Accéder au contenu principal

New York Philharmonic Customer Story

Home >> Customers Stories >> New York Philharmonic

Résultats

  • La première phase du projet, d'une durée de 3 ans, concerne la numérisation d'un million trois cent mille pages de documents d'archivage provenant de l'époque internationale, 1943 à 1970, qui inclut 3 200 programmes, 8 000 dossiers de documents professionnels, 4 200 diapositives sur verre, 8 500 photographies et 72 albums de coupures de presse fragiles.
  • Alfresco contiendra 10 millions de nœuds composés de 5 To de données à la fin de la première phase.
  • Mise en œuvre d'une plate-forme hautement évolutive qui comprendra au final des archives entières numérisées ainsi que des enregistrements audio et vidéo numériques (environ 2 pétaoctets).
  • Implémentation de SOLR pour faciliter la navigation sur le site et donner des résultats de recherche instantanés et pertinents.
  • Processus d'ingestion du contenu évolutif à l'aide des outils OpenMigrate de TSG.
  • Structures de métadonnées personnalisées pour indexer le contenu et fournir un contexte institutionnel aux différents types de documents.
  • Environnement à clusters pour garantir la disponibilité du contenu 24h/24.

Enjeu

Fondé en 1842, le New York Philharmonic est l'orchestre symphonique le plus ancien des États-Unis et le troisième plus ancien orchestre au monde. Les archives du Philharmonic représentent une des collections de recherche orchestrale les plus importantes et les plus anciennes du monde. Elles retracent toute l'histoire du Philharmonic avec ses plus de 15 000 représentations dans le monde entier. C'est un recueil important de l'histoire culturelle à NewYork et partout ailleurs.

En septembre 2009, le New York Philharmonic a bénéficié d'une bourse de 2.4 millions de dollars accordée par la Leon Levy Foundation afin de numériser 1.3 million de pages de contenu provenant des archives de l'orchestre pour les rendre accessibles via Internet aux chercheurs, musiciens, étudiants et au grand public. Les différentes collections des archives contiennent des documents remontant au premier concert du Philharmonic en 1842. La première phase du projet de numérisation se concentre sur l’époque internationale, 1943 à 1970, du Philharmonic. Ceci inclut la numérisation de 1 300 partitions annotées par Leonard Bernstein et André Kostelanetz, 3 200 programmes, 8 000 dossiers de documents professionnels, 4 200 diapositives sur verre, 8 500 photographies et 72 albums de coupures de presse fragiles.

Le Philharmonic est l'un des premiers référentiels institutionnels à s'engager dans un projet de numérisation de cette ampleur et de cette portée, avec, pour objectif, de rendre accessibles tous les documents numérisés au monde entier. Pour réaliser ce projet, le Philharmonic avait besoin d'un système de gestion de documents hautement évolutif capable de traiter une forte demande quotidienne tout en diffusant en continu de grands volumes de données. La solution se devait d'être économique, elle devait pouvoir traiter des fichiers volumineux et avoir de puissantes capacités de gestion d'actifs numériques.

L'organisation s'est concentrée sur la technologie open source, fiable, rentable et facilement évolutive. Le choix de l'open source offre également plus de flexibilité dans la création d'une solution durable à long terme, facile à partager avec d'autres institutions.

Solution

Le Philharmonic a effectué des recherches sur les produits de gestion des contenus professionnels en évaluant Alfresco Enterprise et Fedora Commons, une structure de référentiel numérique très souvent utilisée pour les bibliothèques numériques académiques. L'équipe a sélectionné Alfresco, car l'entreprise proposait un produit commercial assorti de services d'assistance. De plus, il s'agit d'un produit qui peut monter en charge facilement en terme de volumes de contenu, qui prend en charge tout type de fichier et qui bénéficie d'une solide communauté de développeurs. De surcroît, Alfresco peut servir de plateforme de contenu pour les archives numériques du Philharmonic et peut être personnalisé de manière à répondre aux besoins spécifiques de l'organisation à long terme.

Pour aider à l'implémentation d'Alfresco et simplifier le processus d'ingestion du contenu, le Philharmonic s'est tourné vers l'entreprise Technology Services Group (TSG), partenaire d'Alfresco. Le logiciel OpenMigrate de TSG contrôle le flux de toutes les métadonnées et images vers et hors du référentiel Alfresco, permettant ainsi au Philharmonic d'effectuer des importations en masse de métadonnées, d'ingérer des images et de rendre accessibles les actifs sur Internet en indexant le contenu dans l'application de recherche frontale SOLR. Le rendu du contenu est effectué avant l'ingestion à l'aide d'une implémentation autonome d'ImageMagick, une suite logicielle open source qui convertit les images JPEG d'origine en fichiers de format dérivé et de différentes tailles, optimisés pour le Web.

Le Philharmonic utilise des serveurs Windows à clusters pour que les processus d'ingestion et de conversion des images puissent s'adapter au calendrier le plus serré. Chaque jour, quelque 120 000 images JPEG sont ingérées et jusqu'à 75 000 images sont supprimées pour être remplacées par des images corrigées. Au même moment, la diffusion de contenu sur le site frontal doit rester fluide pour le grand public et le contenu doit être vérifié en interne. Ce niveau d'exigence requiert un système hautement évolutif tel qu’Alfresco pour maintenir des index précis tout en permettant l'extraction et la modification rapides du contenu.

La visionneuse de documents utilisée pour la présentation finale des biens numérisés est l'application source ouverte GNU BookReader, lancée par Internet Archive et maintenant hébergée par Open Library (openlibrary.org).

La visionneuse permet aux utilisateurs de faire défiler, de zoomer, pivoter, agrandir, afficher des miniatures et tourner les pages. La méticulosité des méthodes photographiques et des flux de contrôle de qualité du Philharmonic permet aux utilisateurs d'afficher plus de données et de faire une lecture plus approfondie du contenu numérique que ce que ne leur permettrait la consultation physique du document dans la salle de lecture.

Conclusion

  • Les nouvelles archives numériques du New York Philharmonic contiendront plus de 1.3 million de pages provenant de différents supports datant de l'époque internationale, 1943 à 1970.
  • Alfresco servira de plateforme de contenu pour le projet et comprendra 10 millions de nœuds contenant 5 téraoctets de données à la fin de la phase en cours.
  • Les archives numériques sont accessibles gratuitement depuis le monde entier et proposent une interface de recherche complète avec une visionneuse de documents intuitive.
  • Après quatre mois, les archives numériques ont déjà reçu 47 800 visites dont 34 000 visiteurs uniques. 5 264 visiteurs sont revenus sur le site 9 ou 10 fois et 885 visiteurs sont revenus 100 fois ou plus. La partition de la symphonie n° 9 de Malher de Leonard Bernstein a été consultée environ 25 000 fois.
  • Le projet a été mentionné dans le New York Times, Wall Street Journal, sur MusicalAmerica.com, sur Ariama.com, dans The Rest is Noise (le blog d'Alex Ross, critique du New Yorker), sur Playbill.com, sur WQXR.org et dans d'autres médias locaux, nationaux et internationaux.

Quelle est la prochaine étape ?

Le Philharmonic a procédé à la mise à niveau vers Alfresco 3.4.1 et continue de numériser et d'ingérer du contenu dans Alfresco. Sur les 10 prochaines années, le Philharmonic prévoit de numériser toute sa collection de documents (8 millions de pages et 7 000 heures de ressources audiovisuelles), reflétant ainsi l'engagement continu du Philharmonic à fournir un accès le plus large possible à ses collections. Une fois la numérisation terminée, le référentiel devrait contenir plus de 2 pétaoctets de données et 160 ans d'informations d'archives disponibles pour une extraction instantanée. Le Philharmonic souhaite également développer des partenariats avec des institutions académiques et des conservatoires de musique afin de créer des programmes d'études des documents disponibles dans les archives numériques.

Le New York Philharmonic pense également à implémenter la plate-forme Activiti BPM d'Alfresco, un outil léger de gestion des flux de travail et des processus d'entreprise pour simplifier encore plus le processus d'approbation du contenu.

« Se plonger dans nos archives est une expérience unique. Elles contiennent des trésors inattendus et donnent un aperçu de la vie musicale d'une époque passée. »


— Alex Ross, critique du New Yorker et auteur de The Rest is Noise : A l’écoute du XXe siècle, la modernité en musique