New York Philharmonic

Resultados

  • La primera fase del proyecto de tres años incluye la digitalización de 1,3 millones de páginas de material de archivo del Periodo Internacional, 1943 a 1970, que incluye 3200 programas, 8000 carpetas de registros empresariales, 4200 diapositivas, 8500 fotografías, y 72 álbumes de delicados recortes de prensa.
  • Alfresco mantendrá 10 millones de nodos con 5 TB de datos al final de la primera fase.
  • Implementación de una plataforma de contenido altamente escalable que en un momento dado contará con los archivos digitalizados completos, además de registros de origen digital, audio y vídeo (se calcula que unos 2 petabytes de datos).
  • Implementación de SOLR para facilitar la navegación por el sitio y conseguir resultados de búsquedas significativos de forma inmediata.
  • Proceso de ingestión de contenido escalable mediante el conjunto de herramientas OpenMigrate de TSG.
  • Estructuras de metadatos personalizadas para indexar contenido y ofrecer un contexto de material institucional.
  • Entorno agrupado en clústeres para garantizar la disponibilidad del contenido las 24 horas del día.

Reto

La Filarmónica de Nueva York, fundada en 1842, es la orquesta sinfónica más antigua de los Estados Unidos y la tercera orquesta más antigua del mundo. Como tal, los archivos de la Filarmónica son una de las colecciones de investigación orquestal más antiguas e importantes del mundo. Abarcan la historia completa de la Filarmónica y de sus más de 15 000 actuaciones por todo el mundo, y suponen un importante registro de historia cultural que se extiende más allá de Nueva York.

En septiembre de 2009, la Filarmónica de Nueva York recibió una subvención de 2,4 millones de USD de la Fundación Leon Levy para digitalizar 1,3 millones de páginas de material de sus archivos con el fin de ponerlos a disposición de académicos, músicos, estudiantes y el público en general a través de Internet. Las colecciones de los archivos incluyen material que data de 1842, año en que tuvo lugar el primer concierto de la Filarmónica, pero la primera fase del proyecto de digitalización se centra en el Periodo Internacional, 1943 a 1970 de la Filarmónica.

Esto incluye la digitalización de 1300 partituras con apuntes de Leonard Bernstein y Andre Kostelanetz, 3200 programas, 8000 carpetas de registros empresariales, 4200 diapositivas, 8500 fotografías y 72 álbumes de delicados recortes de prensa.

La Filarmónica es uno de los primeros repositorios institucionales que participa en un proyecto de digitalización de tal envergadura con la intención de poner a disposición del mundo entero todo el material digitalizado. Para llevar a cabo este proyecto, la Filarmónica necesitaba un sistema de gestión de documentos altamente escalable que pudiera responder al intenso uso diario y transmitir, al mismo tiempo, grandes volúmenes de datos. La solución debía ser rentable, además de poder trabajar con grandes archivos y contar con capacidades de gran estabilidad para la gestión de los activos digitales.

La organización se centró en la tecnología de código abierto por ser fácilmente escalable, fiable y rentable. Asimismo, el código abierto ofrece más flexibilidad para crear una solución que sea sostenible a largo plazo y que pueda compartirse con facilidad con otras instituciones.

Solución

La Filarmónica investigó diversos productos de gestión de contenido empresarial de código abierto, evaluando Alfresco Enterprise y Fedora Commons, un marco de trabajo para repositorios digitales de código abierto que se usa de forma habitual en bibliotecas digitales académicas. El equipo eligió Alfresco porque ofrece un producto comercial respaldado por servicios de asistencia, puede ampliarse fácilmente para trabajar con altos volúmenes de contenido, es compatible con cualquier tipo de archivos y cuenta con una sólida comunidad de desarrolladores. Además, Alfresco podía servir como una plataforma de contenido para los archivos de origen digital de la Filarmónica y personalizarse para satisfacer las necesidades específicas de la organización en el futuro.

Para facilitar la implementación de Alfresco y agilizar el proceso de ingestión de contenido, la Filarmónica contactó con Technology Services Group (TSG), un socio de Alfresco. El software OpenMigrate de TSG controla el flujo de todos los metadatos e imágenes que entran y salen del repositorio de Alfresco, permitiendo así a la Filarmónica realizar importaciones de metadatos en lotes, ingestión de imágenes y habilitación de activos para la web mediante la indexación de contenido en la aplicación front-end de búsqueda de Solr. El procesamiento de contenido se realiza antes de la ingestión mediante una implementación independiente de ImageMagick, un conjunto de software de código abierto que convierte las imágenes JPEG originales en archivos derivados optimizados para la web de varios tamaños.

La Filarmónica utiliza servidores de Windows agrupados en clústeres para que el proceso de conversión e ingestión de las imágenes pueda escalarse con el fin de satisfacer la programación más exigente. Cada día, se realiza una ingestión de unas 120 000 imágenes en JPEG y se eliminan hasta 75 000 para dejar espacio a las imágenes corregidas que las sustituirán. Al mismo tiempo, el sitio front-end debe poder mantener una distribución de contenido rápida para el uso público, además de una revisión de contenido interna. Este nivel de demanda requiere un sistema altamente escalable como Alfresco que permita mantener índices precisos y ofrecer, al mismo tiempo, una recuperación y modificación de contenido con rapidez.

El visor de activos utilizado para la presentación final de los activos digitalizados es BookReader de GNU, un visor de código abierto que inició Internet Archive y que ahora se aloja en Open Library (openlibrary.org). El visor permite a los usuarios realizar desplazamientos panorámicos, acercar o alejar, girar, ampliar, ver miniaturas y pasar páginas de forma virtual. Los minuciosos detalles que ofrecen los métodos fotográficos de la Filarmónica y los flujos de trabajo de control de calidad permiten a los usuarios finales ver más y hacer más cosas con el activo digital que lo que podrían hacer con el material físico en una mesa de una sala de lectura.

Conclusión

  • Los archivos digitales de la Filarmónica de Nueva York tendrán más de 1,3 millones de páginas de material del Periodo Internacional, 1943 a 1970.
  • Alfresco es la plataforma de contenido para el proyecto y tendrá 10 millones de nodos con 5 TB de datos cuando finalice la fase actual.
  • Puede accederse a los archivos digitales de forma gratuita desde cualquier parte del mundo y ofrecen una completa interfaz de búsqueda con un visor de documentos de sencilla utilización.
  • Durante los primeros cuatro meses, los archivos digitales recibieron 47 000 visitas, 34 000 de ellas únicas. 5264 visitantes regresaron al sitio nueve o más veces, y 885 regresaron 100 o más veces. La partitura de la Novena Sinfonía de Mahler utilizada por Leonard Bernstein se ha visto casi 25 000 veces.
  • El proyecto ha recibido cobertura mediática en The New York Times, The Wall Street Journal, MusicalAmerica.com, Ariama.com, The Rest is Noise (el blog de Alex Ross, crítico del New Yorker), Playbill.com, WQXR.org, y en otros medios de comunicación locales, nacionales e internacionales.

Próximos pasos

La Filarmónica ha llevado a cabo una actualización a la versión Alfresco 3.4.1, continuado la digitalización e ingestión de contenido en Alfresco. Durante los próximos 10 años, la Filarmónica planea digitalizar su colección completa de 8 millones de páginas de documentos y 7000 horas de material audiovisual, lo que refleja el compromiso permanente de la organización para ofrecer el mayor acceso posible a sus colecciones. Una vez finalizado, se espera que el repositorio contenga más de 2 petabytes de datos y 160 años de información de archivos disponibles para recuperación inmediata. La Filarmónica tiene en proyecto desarrollar asociaciones con instituciones académicas y conservatorios de música para crear programas que se centrarán en el material disponible en los archivos digitales.

La Filarmónica de Nueva York tratará también de implementar la plataforma Activiti BPM de Alfresco, un flujo de trabajo ligero y herramienta de gestión de procesos empresariales que agilizará aún más el proceso de aprobación de contenido.