NEWS - HYBRID ECM PLATFORM INNOVATION!

New York Philharmonic

Résultats

  • La première phase du projet, d’une durée de 3 ans, concerne la numérisation d’1,3 million de pages de documents d’archivage provenant de l’époque internationale, 1943 à 1970, qui inclut 3 200 programmes, 8 000 dossiers de documents professionnels, 4 200 diapositives sur verre, 8 500 photographies et 72 albums de coupure de presse fragiles.
  • Alfresco contiendra 10 millions de nœuds composés de 5 To de données à la fin de la première phase.
  • Mise en œuvre d’une plate-forme évolutive qui comprendra au final des archives entières numérisées ainsi que des enregistrements audio et vidéo numériques (environ 2 pétaoctets).
  • Implémentation de SOLR pour faciliter la navigation sur le site et donner des résultats de recherche instantanés et pertinents.
  • Processus d’ingestion du contenu évolutif à l’aide des outils OpenMigrate de TSG.
  • Structures de métadonnées personnalisées pour indexer le contenu et fournir un contexte institutionnel aux différents types de documents.
  • Environnement en cluster pour garantir la disponibilité du contenu 24h/24.

Défi

Fondé en 1842, le New York Philharmonic est l’orchestre symphonique le plus ancien des États-Unis et le troisième plus ancien orchestre au monde. Les archives du Philharmonic représentent une des collections de recherche orchestrale les plus importantes et les plus anciennes du monde. Elles retracent toute l’histoire du Philharmonic avec ses plus de 15 000 représentations dans le monde entier. C’est un recueil important de l’histoire culturelle à New York et partout ailleurs.

En septembre 2009, le New York Philharmonic a bénéficié d’une bourse de 2,4 millions de dollars accordée par la Leon Levy Foundation afin de numériser 1,3 million de pages de contenu provenant des archives de l’orchestre pour les rendre accessibles via Internet aux chercheurs, musiciens, étudiants et au grand public.

Les différentes collections des archives contiennent des documents remontant au premier concert du Philharmonic en 1842. La première phase du projet de numérisation se concentre sur l’époque internationale, 1943 à 1970, du Philharmonic. Ceci inclut la numérisation de 1 300 partitions annotées par Leonard Bernstein et André Kostelanetz, 3 200 programmes, 8 000 dossiers de documents professionnels, 4 200 diapositives sur verre, 8 500 photographies et 72 albums de coupures de presse fragiles.

Le Philharmonic est l’un des premiers référentiels institutionnels à s’engager dans un projet de numérisation de cette ampleur et de cette portée, avec, pour objectif, de rendre accessibles tous les documents numérisés au monde entier. Pour réaliser ce projet, le Philharmonic avait besoin d’un système de gestion de documents hautement évolutif qui pouvait traiter une demande quotidienne lourde tout en diffusant de manière continue de larges volumes de données. La solution se devait d’être économique, pouvoir traiter des fichiers volumineux et avoir des capacités de gestion de biens numériques puissantes.

L’organisation s’est concentrée sur la technologie open source, en raison de sa fiabilité, de sa rentabilité et parce qu’elle est facilement évolutive. Les logiciels open source fournissent également plus de flexibilité dans la création d’une solution durable à long terme qui peut être aisément partagée avec d’autres institutions.

Solution

Le Philharmonic a effectué des recherches sur les solutions de gestion de contenus professionnels en évaluant Alfresco Enterprise et Fedora Commons, un entrepôt documentaire numérique très souvent utilisé pour les bibliothèques numériques académiques. L’équipe a sélectionné Alfresco qui propose une solution d’entreprise open source supportée et maintenue, permettant facilement une montée en charge de volumes de contenus élevés, et qui s’adapte et prend en compte tous types de fichiers, tout en bénéficiant d’une communauté de développeurs importante.” De plus, Alfresco peut servir de plate-forme de contenus pour les archives numériques du Philharmonic et peut être personnalisé de manière à répondre aux besoins spécifiques de l’organisation à long terme.

Pour aider à l’implémentation d’Alfresco et simplifier le processus d’ingestion du contenu, le Philharmonic s’est tourné vers l’entreprise Technology Services Group (TSG), partenaire d’Alfresco. Le logiciel OpenMigrate de TSG contrôle le flux de toutes les métadonnées et images vers et hors du référentiel Alfresco, permettant ainsi au Philharmonic d’effectuer des importations en masse de métadonnées, d’ingérer des images et de rendre accessibles les contenus sur Internet en indexant le contenu dans l’application de recherche frontale SOLR. Le rendu du contenu est effectué avant l’ingestion à l’aide d’une implémentation autonome d’ImageMagick, une suite logicielle en open source qui convertit les images JPEG d’origine en fichiers de format dérivé et de différentes tailles, optimisés pour le Web.

Le Philharmonic utilise des serveurs Windows en clusters pour que les processus d’ingestion et de conversion des images puissent évoluer de manière à répondre au planning le plus exigeant. Chaque jour, quelques 120 000 images JPEG sont ingérées et jusqu’à 75 000 images sont supprimées pour être remplacées par des images corrigées. Au même moment, le site frontal doit conserver une diffusion de contenu rapide pour le grand public et une vérification prompte de ce contenu en interne. Ce niveau de demande requiert un système hautement évolutif tel qu’Alfresco pour maintenir des index précis tout en fournissant une extraction et une modification rapides du contenu.

La visionneuse de documents utilisée pour la présentation finale des biens numérisés est l’application open source GNU BookReader, lancée par Internet Archive et maintenant hébergée par Open Library (openlibrary.org). La visionneuse permet aux utilisateurs de faire défiler, faire un zoom, pivoter, agrandir, afficher des miniatures et de tourner virtuellement les pages. La méticulosité des méthodes photographiques et des flux de contrôle de qualité du Philharmonic permet aux utilisateurs finaux d’afficher plus de données et de faire une utilisation plus approfondie du contenu numérique que ce que ne leur permettrait la consultation physique du document sur une table de la salle de lecture.

Conclusion

  • Les nouvelles archives numériques du New York Philharmonic contiendront plus de 1,3 million de pages provenant de différents supports datant de l’époque internationale, 1943 à 1970.
  • Alfresco est utilisé comme plate-forme de contenu pour le projet et comprendra 10 millions de nœuds contenant 5 téraoctets de données à la fin de la phase en cours.
  • Les archives numériques sont accessibles gratuitement depuis le monde entier et proposent une interface de recherche complète avec une visionneuse de documents conviviale.
  • Après quatre mois, les archives numériques ont déjà reçu 47 800 visites dont 34 000 visiteurs uniques. 5 264 visiteurs sont revenus sur le site 9 à 10 fois et 885 visiteurs sont revenus 100 fois ou plus. La partition de la symphonie n° 9 de Malher de Leonard Bernstein a été consultée environ 25 000 fois.
  • Le projet a été mentionné dans le New York Times, le Wall Street Journal, sur MusicalAmerica.com, sur Ariama.com, dans The Rest is Noise (le blog d’Alex Ross, critique du New Yorker), sur Playbill.com, sur WQXR.org et dans d’autres médias locaux, nationaux et internationaux.

Quelle est la prochaine étape ?

Les contenus du Philharmonic sont maintenant mis à jour sur la version d’Alfresco 3.4.1 et le Philharmonic continue de numériser et d’ingérer du contenu dans Alfresco. Sur les 10 prochaines années, le Philharmonic prévoit de numériser toute sa collection de documents (8 millions de pages et 7 000 heures de ressources audiovisuelles), reflétant ainsi l’engagement continu du Philharmonic à fournir un accès le plus large possible à ses collections. Une fois la numérisation terminée, le référentiel devrait contenir plus de 2 pétaoctets de données et 160 ans d’informations d’archives disponibles pour une extraction instantanée. Le Philharmonic souhaite également développer des partenariats avec des institutions académiques et des conservatoires de musique afin de créer des programmes d’études qui se concentreront sur les documents disponibles dans les archives numériques.

Le New York Philharmonic pense également à implémenter la plate-forme Activiti BPM d’Alfresco, un outil de gestion des flux de travail et des processus d’entreprise léger pour simplifier encore plus le processus d’approbation du contenu.

Download Printer-friendly PDF