平成21年度の調査研究の内容
平成21年度は、3つのテーマについて調査研究を行いました。
(1)録音・映像資料のデジタル化と電子情報の長期保存に関するアンケート調査
国内外の機関におけるアナログ形式の録音・映像資料のデジタル化の実施状況及び電子情報の長期保存に係る取組みの実施状況について、アンケート調査を実施しました。
国内外の国立図書館、国立公文書館、国立フィルムアーカイブ、大学図書館、放送協会等の先駆的な取組みを行っている機関40機関に調査票を送付し、うち当館を含む計20機関から回答を得ました。調査の概要及び結果については、結果報告をご覧ください。
(2)電子情報の恒久保存メディア及びそれを用いたシステムに関する調査
膨大な量の電子情報を扱う大規模なデジタルアーカイブシステムでは、大容量かつ長寿命のメディアが必要となります。そこで、1,000年とも言われる和紙の寿命に匹敵する程度の寿命が期待できる新しいデジタル記憶メディア(恒久保存メディア)の実用化に向けた要件調査とシステムの試作を実施しました。
まず、当館の実例をもとに、大規模デジタルアーカイブシステムで想定される機能、収蔵データ量及び応答時間等を調査し、主に記憶メディアやその装置に求められる要件を整理しました。また、これらの調査結果から、今後の実用システムに向けた課題についても検討しました。
次に、磁気メディア、光学メディア及び半導体メモリ等の既存のデジタル記憶メディアについて、その特徴、大規模デジタルアーカイブシステムにおける利用可能性及び長期保存への適性等について、文献等に基づいた比較調査を行いました。この結果、密封型のマスクROMについて、デジタルアーカイブシステムへの適用可能性、課題等を調査することにしました。マスクROMは、家庭用ゲーム機のプログラムカセットや家電製品など、一般に広く使われている半導体の一種です。記録されている内容を書き換えることができないため、データの消失を防止することが可能です。これをガラスで完全に密封することで、温度や湿度、腐食性ガス等の影響も排除できます。今回の調査では、この密封型マスクROMを非接触で用いるために適した通信方式や電源供給方式等を明らかにし、実際に回路設計・チップ試作を行い、実現可能性を示すための予備評価を実施しました。
最後に、予備評価の結果を基に、密封型マスクROMを利用して電子情報の長期的な保存及びアクセスを可能にすることを目的としたプロトタイプシステムを設計、試作し、評価を行いました。今後の実用化に向けた課題等を検討、整理しました。
調査の結果、既存のデジタル記憶メディアでは、大規模デジタルアーカイブシステムの持続可能性を支えることは困難であり、寿命、体積密度、アクセス速度、コスト等の面で飛躍的に優れたメディアが不可欠であることがわかりました。密封型マスクROMは、寿命と体積密度において改善が期待でき、コストも改善の余地があることがわかりました。プロトタイプシステムの試作からは、安定した通信のためには電源供給によるノイズの影響を軽減する必要がある等、今後の改善につながる知見を得ることができました。また、今後の課題として、密封型マスクROMの寿命を加速劣化試験等で実際に評価することも必要であるということがわかりました。
詳細な調査結果は、「電子情報の恒久保存メディア及びそれを用いたシステムに関する調査報告書」(平成22年3月)をご覧ください。
(3)保存システムの構築に係る要素技術に関する調査
電子情報の長期的な保存と利用の保証を実現するためには、次の機能が必要です。
- 電子情報のデータ形式(ファイルフォーマット)に関する技術情報を適切に管理できる。
- 収集した電子情報がどのファイルフォーマットに当たるかを正しく識別できる。
- 規格やファイル自体が古くなり、再生に必要な機器やソフトウェアが入手できず、再生できない(陳腐化)恐れがあるフォーマットを検知して対策を促す。
上記の機能を備えたシステムを「保存システム」と呼び、今後の実用化に向け、長期保存システムの国際的な標準モデルであるOAIS(Open Archival Information System)に準拠した保存システムのプロトタイプを構築し、そのシステムを利用して実証試験を行い、課題を洗い出しました。
上記の保存システムに必要な機能を実現するために有用と考えられる既存の各種ツール、またこれらの機能と連携して稼働するFOSS(Free and Open Source Software)や商用パッケージのデジタルリポジトリシステムの要素技術について、文献等に基づき、詳細に調査を行いました。
また、日本で現在流通している、または過去に流通した電子情報のフォーマットに関する技術情報を調査し、これらの技術情報を管理するデータベース(フォーマットレジストリ)を構築しました。
プロトタイプには、これらの調査から得た知見に基づき、独自に開発したファイルフォーマットを識別するツールや陳腐化の恐れがあるフォーマットを自動的に検知する機能を既存の識別ツール等と共に実装しました。
この調査の結果、以下のような知見を得ました。
今後の保存システムの実用化に向けては、多様なフォーマットに対する識別ツールの精度向上や、より正しく識別するために必要となるフォーマット情報を充実させたレジストリの構築方法の検討(独自に構築するか、既存のレジストリと連携または活用するか)、フォーマットの陳腐化を判断する指標となるガイドラインの必要性、大量の電子情報を対象としたマイグレーションの自動化とツールの選択と評価を支援する仕組みの検討等が必要であることがわかりました。
また各フォーマットに必要な情報を独自に収集し、管理する作業はコストがかかります。そのため、各フォーマットの開発者等や既存のフォーマット識別ツールやコーデック識別ツールの開発者と情報を収集、共有し、その情報の信頼性が担保できる環境が必要です。このほか、システムを全て独自に構築するのではなく、実績のある既存のツールを調査し、積極的に実装していくことも有効であることも確認できました。
膨大かつ多様なフォーマットの電子情報を長期的に保存するシステムを構築するためには、電子情報自体を保存・管理するだけでなく、フォーマットに関する情報等、保存のために必要な多くの情報もあわせて収集し、蓄積、管理していかなくてはなりません。そのため、今後も既存のツールやシステムの動向を継続的に調査し、他機関等からの情報提供を積極的に活用できるシステムを検討していくことが重要です。
詳細な調査結果は、「保存システムの構築に係る要素技術に関する調査報告書」(平成22年3月)をご覧ください。
上記以外の活動
- 平成21年10月5日~6日、アメリカ・サンフランシスコにおいて開催された第6回電子情報保存に関する国際学術会議(The Sixth International Conference on Preservation of Digital Objects (iPRES) 2009)に当館職員が参加しました。参加報告は、第6回電子情報保存に関する国際学術会議(iPRES2009)<報告>をご覧ください。
- 平成22年2月19日、東京本館において筑波大学知的コミュニティ基盤研究センターと共催で、「ディジタル情報資源の長期保存とディジタルアーカイブの長期利用に関する国際シンポジウム」を公開で開催しました。