New York Philharmonic

【概要】

  • プロジェクト第1フェーズの3年間で、1943年から1970年の国際化の時代と呼ばれた(「The International Era, 1943 to 1970」)時期の、130万ページに及ぶ所蔵資料の、デジタル化を実施。その量は、公演プログラム3,200冊、業務記録簿8,000冊、幻燈用ガラススライド4,200枚、写真8,500枚、プレス記事のスクラップブック72冊。
  • プロジェクト第1フェーズでは、1,000万ノード(データ5 テラバイト分)がAlfrescoの管理対象。
  • デジタル化した所蔵資料に加え、元々デジタル形式で制作されたレコード、オーディオ、動画ファイル(データ2ペタバイト分に相当)も併せて格納可能な、スケーラビリティの高いコンテンツプラットフォームを導入しました。
  • 使い易く、目的のコンテンツを素早く検索できる、ユーザビリティの高いウェブサイトを制作するために SOLRを導入。
  • TSG社のOpenMigrateツールセットを使った、スケーラビリティ拡張性の高いコンテンツ取り込みプロセス。
  • 資料の内容別にインデックス付けが可能なカスタムのメタデータ構造。
  • コンテンツに24時間中断することなくアクセス可能なクラスタ化された環境。

課題

1842年に創立されたニューヨーク・フィルハーモニックは、米国で最も古く、世界で3番目に古い交響楽団です。そのため、その所蔵資料は、世界最古の貴重なオーケストラ調査資料の1つと見なされています。

資料には、創立からの歴史と、世界各地で行われた15,000回以上のコンサートの記録が収められており、ニューヨーク市内外における文化の歴史をひも解く貴重な記録です。ニューヨーク・フィルハーモニックでは、2009年9月にレオン・レビイ財団から助成金240万ドルを獲得し、130万ページにも及ぶこれらの所蔵資料をデジタル化して、研究者や音楽家、学生、一般人にインターネットで公開するプロジェクトに着手することになりました。資料の中には1842年に遡るニューヨークフィル初のコンサートに関する記録もありますが、本プロジェクトの第1フェーズでは、フィルハーモニックの「International Era, 1943 to 1970」(国際化の時代 – 1943~1970年)の資料からデジタル化します。これらの資料には、レナード・バーンスタインやアンドレ・コステラネッツによる書き込みが入った楽譜1,300冊、公演プログラム3,200冊、業務記録簿8,000冊、幻燈用ガラススライド4,200枚、写真8,500枚、プレス記事のスクラップブック72冊などがあります。

この規模の資料のデジタル化とインターネットでの公開に着手した楽団は世界でも稀であり、ニューヨークフィルは先駆け的存在です。このプロジェクトを成し遂げるためには、膨大な量のデータを中断なく配信しながら、大量のアクセスを処理できるスケーラビリティの高いドキュメント管理システムが必要でした。また、費用対効果に優れ、大容量のファイルを処理でき、強力なデジタルアセット管理機能を備えたソリューションでなければなりません。

そこでニューヨークフィルが注目したのは、拡張が簡単で、信頼性と費用対効果に優れるオープンソース技術です。それにオープンソースなら、長期間維持可能なソリューションを柔軟に開発でき、他の楽団や組織との共有も容易です。

ソリューション

ニューヨーク・フィルハーモニックは、オープンソースのエンタープライズコンテンツ管理製品を調査し、Alfresco Enterpriseと、学術関連のデジタルライブラリで一般的に使用されているデジタルリポジトリフレームワークであるFedora Commonsを評価、検討しました。 その結果、サポートサービスが受けられる市販の製品であることや、コンテンツの量に応じて容易に拡張できるスケーラビリティ、対応可能なファイル形式の数、強力な開発者コミュニティによる支援などの観点から、Alfrescoを選択しました。また、Alfrescoがニューヨークフィルで制作されるデジタルアーカイブのコンテンツプラットフォームとしての機能を充足することや、今後のニーズの変化に応じてカスタマイズできる点も決め手になりました。

Alfrescoの導入とコンテンツの取り込みプロセスの一本化を図るため、ニューヨークフィルはAlfrescoのパートナー、であるTechnology Services Group(TSG)社の製品にも注目しました。TSGのOpenMigrateは、メタデータと画像のすべてのフローをAlfrescoのリポジトリに集約するソフトウェアで、メタデータの一括インポートや、画像の取り込み、フロントエンドのSolr検索アプリケーションでのコンテンツのインデックス処理によるアセットのWeb対応可を可能とします。コンテンツのレンディションは、コンテンツを取り込む前に、スタンドアロンのImageMagickを使って行います。ImageMagickは、元のJPEG画像ファイルを、Web用に最適化した様々なサイズの派生ファイルに変換するオープンソースのソフトウェアスイートです。

フィルハーモニックは、プロジェクトの繁忙期に応じて画像の変換や取り込み能力をアップできるように、クラスタ化されたWindowsサーバーを使用しています。JPEG画像ファイルの取り込み量は1日当たり120,000個、変換した画像と差し替えるために削除される画像ファイルの数は最大75,000個に昇ります。同時に、フロントエンドのサイトでは、公開するコンテンツの配信だけでなく、コンテンツの内部校閲も常時スピーディに行わなければなりません。

このようにコンテンツの配信と変更を迅速に行いながら、かつ正確なインデックス処理を可能にするためには、Alfrescoのようなスケーラビリティの高いシステムが必要です。

デジタル化されたアセットの最終版を表示するアセットビューアには、元々インターネット・アーカイブが運営し、現在オープン・ライブラリ(openlibrary.org)がホストするオープンソースのGNU BookReaderを使用しています。 このビューアでは、パンニングやズーム、回転、拡大、サムネイルの表示が可能なほか、ページをめくることもできます。フィルハーモニックの細部にまでこだわった写真技法と品質管理ワークフローにより、これまで閲覧室でしか見ることができなかった資料がデジタルアセットとして蘇り、その活用方法が大きく広がっています。

まとめ

  • ニューヨーク・フィルハーモニックのデジタルアーカイブサイトには、130万ページ以上に及ぶ1943年から1970年の国際化の時代と呼ばれた(「The International Era, 1943 to 1970」)時期の資料が収録される予定です。 
  • 同プロジェクトのコンテンツプラットフォームとして機能するAlfrescoには、現フェーズ中に1,000万のノード(データ5 テラバイド分)が設置されます。
  • デジタルアーカイブサイトには世界中からアクセスでき、分かり易い検索画面と使い易いドキュメントビューアで資料を閲覧できます。
  • サイトへのアクセス数は公開から僅か4ヶ月で47,800回(重複を除いたアクセス数は34,000回)を記録。9回以上アクセスしたユーザーは5,264人、100回以上は885人に昇ります。レナード・バーンスタインのマーラー交響曲第9番の楽譜には約25,000回のアクセスがありました。
  • このプロジェクトはマスコミでも大きな話題を呼び、ニューヨーク・タイムズやウォール・ストリート・ジャーナル紙、MusicalAmerica.com、Ariama.com、The Rest is Noise(ニューヨーク在住評論家、アレックス・ロス氏のブログ)、Playbill.com、WQXR.org、その他の地方、海外のメディアでも取り上げられました。

今後の展開 

ニューヨーク・フィルハーモニックはAlfrescoを最新バージョンにアップグレードし、現在もコンテンツをデジタル化してAlfrescoに取り込む作業を続けています。今後10年間で、800万頁分の文書と7,000時間分の音声・動画資料をデジタル化することからも、コレクションをより多くの人に公開したいというニューヨークフィルの熱意と情熱が感じられます。プロジェクト終了時の総データ量は2ペタバイトを超える見込みで、160年分の所蔵資料に瞬時にアクセスできるようになります。ニューヨークフィルでは今後、学術機関や音楽学校と協力しながら、デジタルアーカイブの資料を題材としたカリキュラムを作成する計画です。

また、技術的な面では、コンテンツの承認プロセスの合理化を図るために、Alfrescoの軽量なワークフローであるActiviti BPMプラットフォームとBusiness Process Managementツールの導入を検討しています。