1990年代に入り、コンピュータの性能の向上とともにマルチメディア機能や大容量メディアを用いて作られる電子出版物が非常に多くなった。一方、インターネットの爆発的普及は、様々な情報資料へのオンラインアクセスを非常な勢いで拡大させてきた。こうした背景の下、世界各国において情報流通性を高めるためのプロジェクトやデジタル図書館の研究開発が国家レベルで推進されてきている。
情報技術の研究分野という観点から見ると、明らかにデジタル図書館は情報技術の応用の研究分野である。その意味では、デジタル図書館の研究には、何らかのコンテンツ(Contents)と情報技術(ComputingとCommunication)とを組み合わせるという観点、利用者の性質や環境なども含む実際的な利用環境における情報技術の適用性や利用性の観点が要求される。また、知的財産権や電子商取引といった領域とも隣り合わせの分野である。
一方、実際の図書館サービスや情報サービスの研究開発の観点から見ると、情報技術の変化に伴う出版環境と利用者環境の進化に適合したサービスを提供するために、どのような新しい要求があるかを知り、「使える」新しい情報技術によって新しいサービスを実現していくことが求められる。利用者の第一の情報アクセスポイントがインターネットにつながれた端末になってきており、しかもその端末が利用者の知的作業の場、すなわちデスクトップになっている。そのため、必要な資料を、ネットワークを介して利用者のデスクトップに届けることが図書館には求められる。また、教育の場でのネットワークの利用の広がり、生涯学習や遠隔教育のように学校に出向かずに行う教育や学習活動の広がりが期待されており、そうした環境を支える重要な機能としてデジタル図書館が求められている。
メタデータがインターネット上での情報流通やデジタル図書館を支える重要な要素として認められている。メタデータは、単純にはデータに関するデータ(Data
about Data)と定義される。インターネットやデジタル図書館環境では、必要な情報資源を探し、探した資源が利用可能かどうか調べ、その資源にアクセスして利用し、必要に応じて料金を支払うという作業を全てネットワーク経由で行うことになる。また、利用される情報資源の単位が1件の記事であったり、1枚の写真であったりすることもある。一方、提供者側の立場からは長期に渡って情報資源を蓄積管理する必要もある。こうした作業において必要とされるのが情報資源に関するいろいろな特性を表すメタデータである。インターネットやデジタル図書館環境においては、応用目的に合ったメタデータ基準を利用できること、複数のメタデータ規則を組み合わせて利用できることが求められる。さらに、いろいろな規則に基づいて作られるメタデータ間での相互利用性が求められる。これは、標準として与えられたメタデータ規則のみならず応用毎に(草の根的に)決めたメタデータ規則を利用することと、異なる規則の下に作られるメタデータをできるだけ相互に利用可能にすることが求められることを意味する。こうした要求にこたえるためにはメタデータ規則を登録し公開するサービス(メタデータレジストリ)が求められる。
以下、本節ではデジタル図書館の研究開発に関する概観とメタデータに関して述べる。前者に関してはアメリカのDigital Library Initiativeを中心に述べる。後者については、インターネット上での情報資源の発見を目的として開発されてきたDublin
Core Metadata Element Setを中心に述べる。最後に、デジタル図書館の研究開発に求められることについて筆者自身の観点から考察を試みる。
デジタル図書館分野の研究開発は大きく分けると、情報技術指向のものと、図書館などのコンテンツ提供者をベースにした実サービスの開発を指向したものに分けることができる。もちろんその間とでも言うべきものもある。
(1) デジタル図書館の研究開発助成プログラム
デジタル図書館分野の研究助成プログラムは欧米で活発に進められている。これまで、アメリカにおいてはNSF、DARPA、NASA他によるデジタル図書館研究助成プログラムDigital
Library Initiative (DLI、Phase 1と2)[1]、NSFによる教育指向のデジタル図書館研究助成プログラムNational
SMETE Digital Library(NSDL)[1]が進められてきている[2]。DLI-1からDLI-2になって、研究助成母体に議会図書館や人文基金(NEH)、医学図書館(NLM)が参加したこともあり、DLI-2では、よりコンテンツと情報技術を結びつけた研究が強調されているように感じる。また、DLI-2では国際間共同研究プロジェクトを推進するため、NSF-JISC(イギリス)、NSF-DFG(ドイツ)、NSF-DELOS(EU)といった国際共同研究助成プログラムを進めている[2]。一方、NSDLは教育環境における情報技術やデジタルコンテンツの活用を進めることを目的として進められている。これは、現在、大学において生涯学習や遠隔教育等が将来に向けたキーワードとなっていることを考えると、長期的な観点からは大きな可能性を持つプロジェクトであると思える。NSFではPresident’s
Information Technology Advisory Committee(PITAC)のレポート[3]に基づいて開始されたInformation
Technology Research(ITR)と呼ぶ大規模な研究助成を進めている[4]。ITRは情報技術全般をカバーする研究助成プログラムである。DLIはITRとNSDLの間にはさまれてしまった感があるが、異分野を結びつける取り組みであること、国際間での協調的助成を進めようとしていることなど、特色ある研究助成プログラムであることは疑えない。付録にDLI-2のプロジェクト一覧、NSDLの一覧を示す。
ヨーロッパにおいても同様に研究助成が進められてきている。イギリスではElectronic Library Program (eLib)が進められてきている[5]。アメリカのDLIが計算機科学寄りにスタートしたのに対し、eLibは図書館寄りの研究助成である。また、1998年に始められたEUによる第5フレームワークでは、Information
Society Technologies(IST)プログラムの中でこの分野が研究助成されている[6]。一方、我が国においては、IPAによる大規模な資料のデジタル化プロジェクトやIPA-JIPDECによる次世代電子図書館システムプロトタイプの研究開発プロジェクトは進められてきているが、DLIなどのように情報技術とコンテンツやコンテンツサービスを結びつける広がりをもつ研究開発助成プログラムは進められてきていない。
デジタル図書館の実現には多様な情報技術を総合的に利用する必要がある。したがって、情報技術指向のデジタル図書館研究プロジェクトを見ていると非常に多様な要素技術が含まれている。個々の情報技術の研究の重要性は当然のこととして、コンテンツと要素情報技術の組み合わせに重点をおくこと、実環境における提供実験に重点を置くことがデジタル図書館の研究プロジェクトの特徴と言えよう。たとえば、DLI-2の大規模なプロジェクトの場合、コンテンツに関する研究者と情報技術の研究者によって作られた研究チームによって、コンテンツと情報技術を組み合わせた研究がいくつも見られる。こうした点がこの分野の特徴と言えよう。
(2) 図書館をベースにしたデジタル図書館開発
具体的な取り組みは、大学図書館や国立図書館を中心に学術情報を中心として進められてきている。インターネットへのアクセス支援などの分野を中心として公共図書館での取り組みも進められている。図書館(あるいは同様な機能を持つ組織)をベースにしたプロジェクトは直接サービスに結びつくものであり、電子的に出版される資料をも含めて多種多様なデジタル資料を提供することが主になっている。特に、学術雑誌を中心に電子出版が進んでいるため、図書館のサービスとして電子雑誌を提供することやデータベースを提供することが進んでいる。こうした電子出版物の提供のほかに、現在進められている図書館での主要な活動には、資料(主として、歴史資料や貴重資料)の電子化と提供、インターネット上のいろいろな情報資源へのナビゲーションのためのメタデータの蓄積と提供がある。また、デジタル資料の長期保存や納本の制度とそれを支える技術、デジタル図書館間の相互利用性、デジタル資料に関する知的財産権の管理制度とそれを支える技術といった問題は、デジタル図書館を長期に渡って実際に運営していく上での重要な問題として認められ、取り組まれている。
図書館で開発したデジタルコレクションをいかに使いやすくするか、いかに利用性を高めるかということも図書館における取り組みにおける重要な話題である。学校や大学での教育に加え、遠隔教育、生涯学習といった教育と学習の機会の広がりを支える上でデジタル図書館は重要な役割を果たすことが期待される。たとえば、資料の電子化を行うだけではなく、デジタル化した資料の教育利用を促進するための取り組みも、「使えるデジタル図書館」を実現する上では重要な要素である。
(3) 情報資源の新しい流通環境への取り組み
プレプリントやテクニカルレポート、学位論文等、以前は通常の商用流通ルートにはのらなかった資料の電子的な蓄積が進み、ネットワーク上で検索し資料にアクセスできるようになってきている。こうしたサービスの間でメタデータの共有や相互利用を進めるプロジェクトOpen
Archives Initiative(OAI)が進められている[7]。これまでは、こうした学術資料を提供する個々のサービス(レポジトリ)ごとに検索利用しなければならなかったのに対し、OAIの取り組みにはリポジトリ間の横断的な検索やメタデータを利用したいろいろな付加価値サービスの可能性を持っている。
一方、出版社や学会等から出版される学術雑誌の電子化が進展するとともに、各出版社がWWW上で抄録を含む書誌情報を無料で検索できるようなサービスを提供している。また、雑誌記事間の参照関係の提供や、従来の雑誌タイトルを越えた仮想的な雑誌の提供といったサービスが行われようとしている。こうした新しい形態のサービスは利用者の情報アクセス行動パターンをこれまでとはまったく違ったものにしてしまう可能性を持っている。
(4) メタデータに関する取り組み
前に述べたようにメタデータはインターネットやデジタル図書館における重要な要素である。インターネット上における情報資源の発見のためのメタデータとして開発されてきたDublin
Core、教育向けの情報資源のためのメタデータであるIEEE-LOM[8]やIMS[9]、電子商取引を指向したIndecs[10]、インターネット上の情報資源の倫理的な内容の記述を指向したPICS[11]など、メタデータに関するいろいろな取り組みがある。また、WWWコンソーシアムでは、多様なメタデータに対応するためのメタデータ記述形式であるResource
Description Framework(RDF)に取り組んできている[12]。また、WWWコンソーシアムのSemantic Webの取り組みはこれまでのメタデータへの取り組みを発展させたものということができる[13]。
デジタル図書館への様々な取り組みの中でメタデータを中心とするものにサブジェクトゲートウェイ(Subject Gateway)がある。サブジェクトゲートウェイは特定の分野の有用な情報資源に関する情報を提供するものである。サブジェクトゲートウェイの実現には対象分野において「有用な」情報資源を見つけ、そのメタデータを作成することが求められる。対象分野において「有用な」情報資源を見つけることとメタデータを作成することはともに現時点では人手に頼らざるをえず、この作業を支援する技術の開発が望まれる。
3.6.3.1 Digital Library Initiative
DLI-1では、スタンフォード大学、カリフォルニア大学バークレー校、同サンタバーバラ校、イリノイ大学アーバナ・シャンペイン校、ミシガン大学、カーネギーメロン大学の6大学で進められたほぼ同規模の6つのプロジェクトに4年間で2300万ドルの助成が行われた。
DLI-2では、それまでの助成母体に加えて、議会図書館(LoC)、医学図書館(NLM)、人文基金(NEH)が参加することになり、さらにFBIも加わっている。また、公文書・記録管理局(NARA)やスミソニアン協会他も協力している。DLI-2は1998年秋から開始されることになっていたが、実際に1998年秋に開始されたものは比較的小規模なもののみで、大規模プロジェクトは1999年になってから開始された。さらに2000年にもプロジェクトが追加され現在にいたっている。
DLI2のプロジェクトの中の総額100万ドル以上の大規模プロジェクトの中で、スタンフォード大学、カーネギーメロン大学(CMU)、カリフォルニア大学バークレー校(UCB)、サンタバーバラ校(UCSB)はDLI-1でも助成されていたグループであり、内容的にも継続的色彩が強い。また、この内カリフォルニア州の3大学のプロジェクトは互いに協力関係を持つことを前提にしており、カリフォルニア大学の9キャンパスを結んで進められているCalifornia
Digital Library上で試用できるようにすることを予定している。ミシガン州立大学のプロジェクトは20世紀に記録されてきた様々な講演・演説の録音データの検索可能なオンラインリポジトリを構築する。コロンビア大学のプロジェクトは、個人利用者による利用を指向した医療情報の分散デジタル図書館を作り上げようというものである。コーネル大学のプロジェクトでは、信頼性、セキュリティ、保存性といったデジタル図書館を十分に頼りにできる完全なものにするための技術基盤を研究する。インディアナ大学ではマルチメディア機能を利用したMusic
Digital Libraryのテストベッド開発を行う。このように、人文科学、社会科学、自然科学・技術の広い分野をカバーしていることが理解できる。
3.6.3.2 図書館での活動
図書館での活動は大まかに分けて、(1) 既存の資料のデジタル化による保存と提供、(2) 電子的に出版される資料の提供、(3) インターネット上の情報資源に関する情報の提供による利用者の情報アクセス支援、(4)
その他、ネットワーク利用環境や知的財産権、子供向け情報資源の整備等であろう。これまで、国立図書館や大学図書館を中心に開発が進められてきているが、教育(子供から大人まで)や地域の振興を考えると公共図書館での活動がもっと活性化してもおかしくないと思われる。
デジタル図書館に関する図書館ならではの話題としては、電子化資料の保存、特にもともと電子的に作られ出版された資料の長期に渡る保存の問題がある。この問題は納本図書館の役割を持つ図書館にとっては非常に重要な問題である。従来、図書館ではマイクロフィルムを用いて資料を保存するということが行われてきている。その観点からは、マイクロフィルムの代わりにデジタル媒体に変換していると言える。また、ネットワークを使って提供することで「保存とアクセスの両方を可能にする」ということは、ある種の決り文句でもある。一方、情報技術の進歩の速度が非常に早く、保存媒体の実質的な寿命が短いため長期に渡る資料の保存のために新しい媒体への移植を続けていくことが要求される。
保存の観点から性質が悪い資料は、もともと電子的に著述され、出版される資料(Born Digital)である。たとえば、音声やビデオを含むハイパーテキストとして編集されCD-ROMの形で出版された資料を、長期に渡って「使える状態で」保存することを考えてみるとこの問題の大きさが簡単に理解できる。また、最近では、インターネット上に提供される資料にも長期保存の対象とすべきものが多くなってきている。この場合、ひとつのファイルがひとつの資料であるということは必ずしも言えないために「ひとまとまりの資料」をどのように矛盾なく収集するかということ、資料の閲覧のためにplug-inソフトウェアを要求されることがあることなど解決すべき問題が残されている。
3.6.3.3 その他の活動
インターネット上での学術情報資源の共有を進めるための取り組みが進められている。先に示したNSDLやOpen Archives Initiative(OAI)はそれらのひとつであると言える。OAIは、共通のメタデータ規則やメタデータのHarvestingプロトコルなどを決め、利用者に対してリポジトリ間の違いをなくし、また付加価値サービスの可能性を高めることを目的としている。このプロジェクトはテクニカルレポート等を提供するための共通の基盤としての可能性を持つこと、またこれまでとは違った付加価値サービスを生み出す可能性を持つ。そのため、利用者の学術情報へのアクセス行動パターンに影響を及ぼす可能性を持っていると言えよう。
ネットワーク上での情報資源への効率的なアクセス環境を作り上げるには、情報資源を提供する組織間での協調的な取り組みが重要である。その観点からはOAIは良い例であると言えよう。また、先に述べたようにサブジェクトゲートウェイの実現はまだ人手による部分が大きくコストが高くつく。そのため、有用な情報資源を協調的に見つけることや、作成したメタデータの協調的な利用を進めることが求められる。その点ではヨーロッパでのRenardusやImeshといったサブジェクトゲートウェイ間の協調を進める取り組みは大事な役割を持っていると思える[14][15]。
デジタル図書館やインターネット環境において情報資源を探し、アクセスし、利用するためには情報資源に関する情報を記述したデータ、すなわちメタデータが必要不可欠である。メタデータに関する取り組みはいろいろなコミュニティで行われている。筆者はここ数年Dublin Coreに関わってきた。以下ではDublin Coreの現状を簡単に述べたい[16]。
3.6.4.1 概観
Dublin Coreの開発はメーリングリストによる議論と年に1、2回開かれるワークショップでの議論を通じて進められてきた。最近のワークショップとしては、1999年10月にフランクフルトのドイツ国立図書館で開催された第7回ワークショップ(DC-7)と2000年10月にカナダ国立図書館で開催された第8回ワークショップ(DC-8)があり、ここではこれらについて簡単に述べる。なお、第9回ワークショップは規模を大きくして東京の国立情報学研究所で2001年10月に開催する予定である[17]。
(1) DC-7およびDC-8について
DC-7での重要な成果はDCMIとして推奨するqualifierを2000年1月までにアナウンスすることをアナウンスした点であった。qualifierとは、次項に示すように、エレメントの意味をより正確に示すために、エレメントの表す意味を限定、あるいはエレメントに表す値のボキャブラリや記述形式を表現するものである。このほかには、今後Dublin
Coreの開発を続けていく上でのバージョン管理に関する議論、実応用に即した議論を進めるためのワーキンググループの設置等がDC-7での主たる話題であった。
DC-8は一般の参加者を受け付けた初めてのワークショップであった。これは、それ以前のワークショップが参加者を招待者に限っていたのに対してワークショップに対する要求が変化しだしてきたことを意味している。
(2) qualifierに関して
DCMESの基本エレメントのみでメタデータを表そうとすると意味が十分に詳しく表現できないという要求が以前からあり、qualifierはかなり以前から議論されてきたものである。たとえば、論文の著者を著す場合、その人の「名前」、「所属」といったことを表したくなる。また、ある資料に関する日付を表す日付(Date)エレメントを考えた場合、表されている日付が、この資料が「作られた日付」、「公開された日付」、「更新された日付」、「無効になる日付」などいろいろな可能性がある。したがって、こうした日付の種類を明確に表す記述方法が欲しくなる。また、主題(Subject)エレメントの場合、表された主題語がどのような統制語彙、たとえばLCSHやMeSH、に基づいて表されているのかを書き表したい場合がある。このように要素の表す意味をより厳密にしたり、要素に与えられる値の範囲を制約したりするために用いられるものがqualifierである。DC-7の後、エレメントを議論してきたワーキンググループからqualifierの提案が出され、それに関する投票が進められた。最終的な投票はDC-7での計画より遅れ2000年4月に行われた。その後qualifierの定義の表現方法を改め、2000年7月に正式にアナウンスされた。
(3) バージョンに関して
現時点で基本15エレメントについてバージョン1.0と1.1がある。しかしながら、バージョン1.1はバージョン1.0の参照記述の表現を改めたものに過ぎないので、実質的には単一のバージョンしか存在していない。また、qualifierセットに関しても現時点ではひとつのバージョンしかない。しかしながら今後、利用経験が増えるにしたがってエレメントやqualifierの改訂の要求が出てくることが考えられる。長期に渡るDublin
Coreメタデータの安定した利用を考えると、一貫したデータの利用を可能にするためのバージョン定義の必要性が認められている。現時点ではバージョンに関するDCMIでの合意はまだ得られておらず、今後の議論によることになっている。
(4) 拡張エレメントに関して
応用分野によってはDCMESの基本15エレメントだけではカバーできない内容の記述が必要になる場合がある。たとえば、教育分野の資料の場合、ある資料がどのような学年、あるいは年齢の利用者に対するものであるのかを記述することが求められる。また、政府関係資料の場合、ある資料に関係する役所、たとえば何らかの制度を所掌する役所の記述が求められる。ところがこうした記述に適したエレメントは基本15エレメントの中には含まれていない。こうしたエレメントを応用目的に基づくエレメントとしてDCMIが認める(推奨する)エレメントとして承認する必要がある。たとえば、教育分野での利用のためのワーキンググループでは2000年10月にワーキンググループとしての提案書をまとめており、そこではaudience他のエレメントとqualifierの提案を行っている。
(5) レジストリに関して
Dublin Coreの利用が広がるにつれて応用毎の拡張(特にqualifier)や各国語での利用が進められている。こうした利用の広がりを支えるにはDCMESの標準を与える参照記述、応用毎のメタデータ記述規則の特性と標準的規則との間の関係を定義するApplication
Profile、メタデータ規則の利用ガイド等をネットワーク上で簡単にアクセスできるようにする必要がある。こうした記述はDublin Coreに基づくメタデータの相互利用性を保つ上でも重要な役割を果たすことになる。また、新たにメタデータの蓄積を始めようとする組織が、応用毎に拡張された部分をも含めて既存のメタデータ規則を参照できることは、メタデータの開発を効率的に行うための助けとなるのみならず、メタデータの相互利用性を高める上でも有用であると期待できる。こうした記述規則等を登録し提供するサービスがレジストリである。こうした背景からDCMIの下にレジストリに関するワーキンググループが作られ、レジストリのための技術開発やRDF等の既存技術を利用したレジストリ開発が進められている。我が国でもメタデータ開発があちこちで進められており、こうした開発を進める組織間での情報交換、相互利用性の促進のためにもメタデータレジストリの開発が必要であると思われる。
(6) エレメントやqualifierの追加と今後の維持管理に関して
DCMIでは新しいエレメントやqualifierの承認のためにUsage Committeeと呼ばれる委員会を作り、その委員会での投票を基に新しいエレメントやqualifierを承認することにしている。2000年7月に行われたqualifierの承認の際にはAdvisory
Committeeの中のボランティアでUsage Committeeを構成し、提案されたqualifierの中から2/3以上の賛成を得られてものについて推奨qualifierとして承認した。今後はUsage
Committeeを独立したCommitteeとして構成することになる。
一方、様々な地域や分野に根ざすコミュニティでのDublin Coreの利用が進むと、それぞれのコミュニティで新しいqualifierやエレメントが利用されることになる。こうした新しい要素を世界全体のコミュニティでの推奨される要素として承認するためのプロセスのモデルを明確化する必要がある。現時点では下の3段階によるプロセスを前提として今後の活動を進めていくことになっている。
第1段階: | あるqualifierがローカルなコミュニティ(地理的に形作られるコミュニティ、応用分野毎のコミュニティ)の中で認知され、利用される段階。 |
第2段階: | そのqualifierがローカルなコミュニティからグローバルなコミュニティによる利用のためにDCMIに提出され、グローバルなコミュニティにおける相互利用性のために推奨できるかどうかはわからないが、Dublin Coreのqualifierとして問題ないとDCMIによって認められた段階。 |
第3段階: | そのqualifierがDCMIの中に設けられた利用に関する委員会(Usage Committee)によって審査され、Dublin Coreのグローバルなコミュニティとしての相互利用性のために推奨するに値すると判断した段階。 |
こうした段階に加えてqualifierの中には利用されなくなり、無効であるとされるものもでてくる。
コミュニティにおける新しいqualifierに関する合意の形成方法、それらのグローバルなコミュニティへの提案方法等、今後の実践の中で明らかになっていくものと思われる。たとえば、日本語で書くメタデータの場合、名前の読みは必要な情報であるが、現在のqualifierには含まれていない。同様に、日本10進分類(NDC)を表すものもない。そこで「読み」や「NDC」を表すqualifierをグローバルなコミュニティで利用できるようにするには、日本語のメタデータを定義、利用するコミュニティを形成し、そこでの議論を元にDCMIに提案する必要がある。
3.6.4.2 qualifierについて
先に述べたように、基本15エレメントはDC-5で実質的に固定し、それ以降変更はされていない。qualifierに関して、第6回ワークショップ(DC-6,アメリカ議会図書館,1998年秋)ではDumb-Down原理が提案された。これは、次のようにqualifierを定義する際の原則を与えるものである。
ここではアメリカにおける研究開発活動を参考に、デジタル図書館の研究開発の目指すことに関して考えてみたい。
3.6.5.1 これまでの研究開発プロジェクトから
DLIは、従来あまり結びつくことのなかった計算機技術と何らかの分野のコンテンツとを結びつけることで新しい情報技術を生み出すことを目的として始められたものである。たとえば、DLIを推進している部門であるNSFのInformation
and Intelligent Systemsの前Division DirectorのY.T.Chienは、論文[18]の中で、ネットワークや情報技術の進歩によりコンテンツ(Contents)や協調作業(Collaboration)が発展し、またそれによって計算機技術(Computing)や情報通信技術(Communication)が進歩するというように、互いに進歩を促進しあっていることを述べている。そうした中で人間の持つ様々な知識に基づき人間の活動を高める役割を果たすKnowledge
Networkのひとつとしてのデジタル図書館の研究について述べている。また、この論文の中では、DLI-1の6プロジェクトに関心を持ちサポートした企業がComputing、CommunicationとContentsの分野にまたがっていることも示されており、これらの領域にまたがる学際的な取り組みの重要性が理解できる。DLI-2において、計算機技術や情報通信技術はあまり持たないが、コンテンツを多く持つ議会図書館や人文基金、医療・保健衛生情報の分野で大きな役割を果たしてきた医学図書館が研究助成母体として参加したことからも、情報技術とコンテンツの総合的な視点からの取り組みを進めることの重要性に対する理解の広がりが理解できる。
DLIに代表される技術寄りの取り組みとは別に図書館でのデジタルコレクションの開発や電子出版物の提供など、実際のデジタル図書館への取り組みも活発に行われてきている。たとえば、ミシガン大学図書館の例を見ると、資料の電子化によるコンテンツ開発にとどまらず、コンテンツと情報技術を組み合わせて実際に使えるサービスを提供することの重要性が良く理解できる[19]。また、OAIの取り組みに見られるようにように、必ずしも実際の図書館と直接の関係は持たないが、デジタルコレクションの蓄積と提供の取り組みが進められてきている。
3.6.5.2 PITACによるデジタル図書館に関するレポートから
2001年2月にPITACから重要な分野として認められている医療・保健衛生と教育に関して3つのレポートTransforming Health
Care Through Information Technology,Digital Libraries: Universal Access to Human
Knowledge,using Information Technology to Transform the Way We Learnが出された[20]。このレポートの中で、社会の構成員である全ての市民が情報化社会の利益を享受できるようにするために、Digital
Libraryは中心的な役割を持っていると述べられている。また、このレポートの中でPITACがDigital Libraryの研究として見出した重要な点として以下の点を挙げている。
1) | インターネットで様々な情報資源にアクセスできるようになったとは言っても実際にアクセスできる情報資源の量は全情報資源の中のごく一部でしかない。様々な種類のデジタル図書館、特に大規模なデジタル図書館を開発し、実際に利用することで本当の進歩が期待できる。そのため、合衆国政府によるデジタル図書館の研究開発の推進が望まれる。 |
2) | 政府機関の共同助成で進められたDLI、特にDLI-2からも理解できるようにデジタル図書館への関心は政府組織内にも広くある。また、NASA等がデータを提供しそれに基づいて研究が進むなど、政府組織が持つ情報を広く提供することによる研究開発の進歩が見られる。こうした取り組みによる進歩をより進めるため、政府のより積極的な取り組みが求められる。 |
3) | 図書館、博物館、美術館、文書館などはデジタルコレクションを長期に渡って保存していくという大きな問題に直面している。情報技術の進歩によって新しい情報媒体が現れ、そうした新しい媒体を用いて新しい資源がどんどん作られる一方、それらの保存が大きな問題になるというのは皮肉なことではある。しかしながら、米国議会図書館のレポート[21]にもあるように、デジタル形式で作られる学術的・文化的財産を長期に渡って保存していくことは、解決を進めるべき重要な問題である。 |
4) | デジタル図書館を作り上げ、実際に利用できるようにするために知的財産権に関する取り組みが求められている。 |
上の認識を基礎に次のような勧告がなされている。
1) | メタデータ及びその利用、大規模システムの実現可能性、相互利用性、アーカイブと長期保存、知的財産権、プライバシ、セキュリティ、および利用者による利用性に関する研究の拡大。 |
2) | 政府助成によるいくつかの大規模なデジタル図書館プロジェクトの推進。 |
3) | 政府によって作られたすべての公共目的のコンテンツをデジタル形式でインターネット上に永続的に提供するための政府による助成。 |
4) | デジタル時代における知的財産権を適切に扱うための方策を決める上で合衆国政府がリーダーシップを取ること。 |
3.6.5.3 国内の状況を見ると − 協調的な取り組みの必要性
国内の研究開発プロジェクトの例を挙げ、デジタル図書館の取り組みについて少し見てみたい。
(1) | Ariadne[22] 京都大学を中心に進められたもので、機械翻訳技術や図書の構造に基づく検索技術等を利用した電子図書館に関する研究を進めたものである。現在、京都大学附属図書館が提供している電子図書館の基礎となっている。 |
(2) | NACSIS-ELS 学術情報センター(現、国立情報学研究所、NII)で進められた学術雑誌記事を電子化、提供するシステムに関する研究である[23]。システムの実用化が進められ、現在、日本の多数の学協会が出版する雑誌がNACSIS-ELS上で提供されている。 |
(3) | パイロット電子図書館システムと次世代電子図書館技術研究開発プロジェクト 国立国会図書館の協力を得て通産省が進めたパイロット電子図書館システム事業では情報処理振興事業協会(IPA)により、多種・大量の資料の電子化とそれを用いたパイロット電子図書館システムの開発が行われた[24]。それに続きIPAと日本情報処理開発協会(JIPDEC)により進められた次世代電子図書館技術研究開発プロジェクトでは、電子図書館を実現するための要素技術とそれを組み合わせた電子図書館プロトタイプシステムの実現が進められた[25]。 |
(4) | 学術雑誌の出版支援システム 科学技術振興事業団によるJ-STAGE[26]と国立情報学研究所によるオンラインジャーナルプロジェクト(NACSIS-OLJ)[27]では、学会が雑誌を電子的に編集・出版し、流通させることを支援するシステムの開発が進められてきている。学会による出版物の電子的な出版と流通を促進する上で、こうしたサービスが重要な役割を果たすことが期待されている。 |
(5) | 慶應義塾大学のHUMIプロジェクト 英国図書館とも共同し、グーテンベルクの42行聖書の電子化を進めている。新しい情報技術を用いて貴重資料を電子化し、単に見るだけではなく人文科学分野の研究にも利用できるように提供するための試みが進められている[28]。 |
(6) | 国立国会図書館での取り組み 国際子供図書館での児童資料の電子的な提供に関する取り組み、電子図書館機能がひとつの柱となる関西館(2002年開館予定)に向けた電子図書館への取り組みが進められている。たとえば、後者の場合、明治期の出版物(約17万冊)の電子化と提供、インターネット情報資源のメタデータの提供等がある。また、電子出版物の法定納本が開始されたこともあり、電子出版物の長期保存が重要な課題となっている。 |
(7) | 国立大学を中心とする大学図書館でのデジタル図書館への取り組み 1996年に出された学術審議会建議「大学図書館における電子図書館的機能の充実・強化について」によって、大学図書館での電子図書館機能の推進が求められた。それに基づき、京都大学、奈良先端科学技術大学院大学、東京工業大学などをはじめとして電子図書館サービスの実現が進められている。そこでは各大学の特色も踏まえ、貴重資料の電子化、学内出版物の電子化と提供、サブジェクトゲートウェイ機能の提供など、いろいろな努力がなされている。また、電子ジャーナルの提供も進んできている。 |
この10年ほどの間に情報へのアクセス方法はすっかり変わり、ネットワークが必要な情報資源を探すための第1の入り口になってしまったといえる。たとえば、雑誌論文を探して読むのもインターネット経由であるし、何か探したければまずはGoogleでも使って検索、ということになっているように思う。一方、情報の発信方法も大きく変化し、これからもどんどんインターネット上での情報発信が増えていくことは疑えない。
PITACレポートにもあるようにデジタル図書館は将来の情報社会の中で重要な役割を持つことは疑えない。デジタル図書館といっても従来の図書館を電子化したものととらえる必要はなく、いろいろな情報や知識にアクセスするために我々の周りに整えられるべき環境、すなわち社会基盤(infrastructure)であるととらえればよい。そうした社会基盤を作って行く上で、コンテンツと情報技術を基礎にするデジタル図書館の研究がさらに求められていると感じる。
参考文献
[1] “Digital Libraries Initiative Phase 2” http://www.dli2.nsf.gov/
[2] “National Science, Mathematics, Engineering, and Technology Education Digital Library” http://www.nsdl.nsf.gov/
[3] President's Information Technology Advisory Committee Report to the President, Information Technology Research: Investing in Our Future, http://www.itrd.gov/ac/report/, 1999.2
[4] Information Technology Research, http://www.itr.nsf.gov/
[5] “eLib:The Electronic Libraries Programme” http://www.ukoln.ac.uk/services/elib/
[6] “Information Society Technologies Programme” http://www.cordis.lu/ist/home.html
[7] “the Open Archives Initiative” http://www.openarchives.org/
[8] “IEEE Learning Technology Standards Committee” http://grouper.ieee.org/groups/ltsc/
[9] “IMS Global Learning Consortium, Inc.” http://www.imsproject.org/
[10] “Indecs Home Page” http://www.indecs.org/
[11] Platform for Internet Content Selection, http://www.w3.org/PICS/
[12] Semantic Web Activity: Resource Description Framework (RDF), http://www.w3.org/RDF/
[13] Semantic Web Activity http://www.w3.org/2001/sw/
[14] “The Resource Discovery Network (RDN)” http://www.rdn.ac.uk/
[15] “Renardus: The Clever Route to Information” http://www.renardus.org/
[16] Dublin Core Metadata Initiative, http://dublincore.org/
[17] 杉本重雄 “Dublin Coreについて―最近の動向、特にqualifierについて”『デジタル図書館』No.18, pp.36-48, 2000.7
[18] Chien, Y.T., Digital Libraries, Knowledge Networks, and Human-centered Information Systems, Proc. of ISDL’97, pp.63-69, 1997.11 (http://www.dl.ulis.ac.jp/ISDL97/proceedings/ytchien/ytchien.html)
[19] Price-Wilkin, John “Moving the Digital Library from “Project" to "Production"” 『デジタル図書館』 No.14, 1999.3, pp.26-62
[20] Digital Libraries: Universal Access to Human Knowledge, President’s Information Technology Advisory Committee, Panel on Digital Libraries, 2001.2
[21] LC21 A Digital Strategy for the Library of Congress, http://www.nap.edu/html/lc21/, 2000
[22] Nagao, M. “Multimedia Digital Library: Ariadne” ISDL’95論文集, 1995.8, pp.1-4
[23] 安達淳 “学術情報センターのデジタル図書館プロジェクト” 『情報処理』, Vol.37, No.9, 1996.9, pp.826-830
[24] 藤原達也, 田屋裕之 “パイロット電子図書館システム事業概要” 『情報処理』, Vol.37, No.9, 1996.9, pp.836-840
[25] Mukaiyama, H. “A Large Scale Component-Based Multi-media Digital Library System – Development Experience and User Evaluation” ECDL200論文集, Springer (LNCS 1923), pp.336-339, 2000.9
[26] “J-STAGE 科学技術情報発信・流通総合システム” http://www.jstage.jst.go.jp/ja/
[27] “オンラインジャーナルプロジェクト” http://www.nacsis.ac.jp/olj/index.html
[28] HUMI project, http://www.humi.keio.ac.jp/
DCMES Element |
Element Refinement(s) |
Element Encoding Scheme(s) |
Title |
Alternative(別タイトル) |
− |
Creator |
− |
− |
Subject |
− |
LCSH,MeSH,DDC,LCC,UDC |
Description |
Table Of Contents(目次) Abstract(抄録) |
− |
Publisher |
− |
− |
Contributor |
− |
− |
Date |
Created(生成),Valid(有効),Available(利用可),Issued(発行),Modified(修正) |
DCMI Period, W3C DTF |
Type |
− |
DCMI Type Vocabulary |
Format |
Extent(範囲・長さ) |
− |
Medium(媒体) |
IMT |
|
Identifier |
− |
URI |
Source |
− |
URI |
Language |
− |
ISO 639-2,RFC 1766 |
Relation |
Is Version Of(版である),Has Version(版を持つ),Is Replaced By(置き換えられたものである),Replaces(置き換えるものである),Is Required By(必要とされる),Requires(必要とする),Is Part Of(部分である),Has Part(部分である),Is Referenced By(参照される),References(参照する),Is Format Of(形式である),Has Format(形式をもつ) |
URI |
Coverage |
Spatial(空間範囲) |
DCMI Point,ISO 3166, DCMI Box,TGN |
Temporal(時間範囲) |
DCMI Period,W3C-DTF |
|
Rights |
− |
− |
付録1: DLI2で研究助成を受けたプロジェクト
参考資料Edward Fox, Digital Library Initiative (DLI) Projects, ASIS
Bulletin, 1999.11より
「UE」と付けたものは学部教育指向のもの
(注)大学名の表記について:“Univ. of”や”University”の部分は省略した。ただしUniversity of CaliforniaについてはUC,Carnegie
MellonはCMUと記した。
機関・代表者 |
開始年/ |
助成額 |
内容 |
Stanford・Wiederhold |
1999/3 |
520 |
医療診断や研究で利用されるイメージに関するプライバシやセキュリティのためのイメージフィルタリング技術 |
Arizona・Chen |
1999/3 |
500 |
医学分野の大容量テキストデータの自動分類生成と人手によって作成された分類との間の自動統合化のためのアーキテクチャと関連技術 |
Texas・Rowe |
1999/3 |
500 |
高精度X線CTによる脊椎の3次元イメージの提供 |
Tufts・Crane |
1999/5 |
2,760 |
人文科学分野において学際的に利用できる大規模デジタル図書館基盤の構築 |
Washington・Etzioni |
1999/2 |
600 |
WWW上の情報資源のための自動化されたリファレンスツールの開発 |
UC Berkerey・Wilensky |
1999/5 |
5,000 |
学術出版のモデルを捉え直して高度な情報の配布・提供のための技術を開発する。 |
Columbia・McKeown |
1999/5 |
5,000 |
マルチメディアデータを含む医療情報のためのインターネット環境における個人向け情報アクセス技術の開発 |
Cornell・Lagoze |
1999/4 |
2,270 |
信頼性、安全性、保存性を提供するアーキテクチャを研究し、それに基づくプロトタイプを開発する。 |
Harvard・Verba |
1999/3 |
1,800 |
社会科学分野の数値データを共同利用するための仮想データセンターの実現に向けた様々なツールや環境を構築する。 |
Indiana ・Palakal |
1999/3 |
310 |
個人向けに情報をフィルタリングし配布する知的システムの開発 |
Johns Hopinks・ Choudury |
1999/3 |
530 |
演奏や高機能な検索による電子化した楽譜コレクションの利用性の向上 |
Kentucky・ Seales |
1999/3 |
500 |
人文科学分野の貴重資料の補修のための照明技術、領域あるいはデータ依存の格納や高度な検索機能のための意味的モデルの開発 |
Michigan State ・ Kornbluh |
1999/5 |
3,600 |
記録音声(スピーチ)の検索可能なオンラインデータベースの開発 |
Oregon Health Science・Gorman |
1999/3 |
650 |
専門家の情報アクセス過程を参考にした情報資源発見の支援機能の開発。保健管理分野を対象として行う。 |
Pennsylvania・Buneman |
1999/3 |
500 |
データの生成・維持過程を扱うことをも含めた新しいデータモデルとその管理機構の開発。 |
South Carolina・ Willer |
1999/4 |
1,200 |
社会・経済学分野の実験、シミュレーションおよびアーカイブのためのソフトウェアとデータのライブラリの開発 |
Stanford・Garcia-Molina |
1999/5 |
4,300 |
不均一な情報とサービス、高性能なフィルタリング機能の不足、利用性に優れたインタフェースの欠如、商取引やプライバシ保護のための機能の欠如といったこれまでのDLにおける障害をできるだけ小さくするための技術開発 |
CMU・Wactlar |
1999/4 |
4,000 |
DLI1におけるInformedia Digital Video Libraryに引き続きビデオ資料の検索と情報発見のための技術を開発する。 |
UC Santa Barbara・Smith |
1999/5 |
5,400 |
Digital Earthメタファーに基づき地理情報に関する様々なデータとそれを扱うサービスのための技術を開発する。 |
Carnegie Mellon・Myers |
1999/3 |
450 |
ビデオ資料を対象とした、使いやすいグラフィカルな編集ツール |
UC Davis・Armistead |
1999/3 |
500 |
Judeo-Spanishの民話、物語、詩などのマルチメディアコレクションの構築 |
UC Berkerey・Agogino |
1998/2 |
400 |
SMETE libraryのための利用者要求を評価するためのモデルとそれに基づくシステム仕様の開発等(UE) |
Columbia・Wittenberg |
1999/3 |
580 |
地球科学分野の先端的な教育・研究資料等の配布・提供のためのモデルの開発(UE) |
Georgia State ・Owen |
1999/3 |
330 |
グラフィックスと可視化技術の教育資料のコレクションとその利用モデル、利用者コミュニティの開発(UE) |
Maryland・Druin |
2000/3 |
610 |
子供のための教育資料を提供するデジタル図書館のための情報アクセス支援のモデルと技法の開発(UE) |
Texas・Kappelman |
1998/2 |
290 |
動物の骨格の3次元データを提供するlibraryの実現(UE) |
Old Dominion・Maly |
1998/1 |
80 |
SMETE libraryに向けたツールやプロセスの開発(UE) |
UC Los Angeles・Englund |
2000/3 |
650 |
楔形文字に関する種々の文書やデータをデジタル資料として蓄積、出版、利用できるようにするためのソフトウェアツールと利用技術を開発する。 |
Eckerd College・Debure |
2000/2 |
30 |
イルカの背びれの写真に基づくイルカの固体の自動的な識別のためのソフトウェアの開発 |
Illinois Chicago・Ben-Arie |
2000/3 |
360 |
人間の動きをデジタル化して提供するlibraryの開発 |
Hawaii,Manoa・Tiles |
2000/3 |
350 |
中国古典の重要なテキストの電子テキスト化とインターネット上での研究教育のためのデータベースの開発 |
Indiana・McRobbie |
2000/5 |
3,050 |
Digital Music Libraryのテストベッドの開発。 |
Massachusetts・Manmatha |
2000/3 |
450 |
手書き歴史資料の自動indexing技術の開発 |
Stanford・Perry |
2000/3 |
520 |
デジタル環境において協調的に新しいアイデアを書き表し、記録し、まとめるといった哲学者の活動を支援する環境と、哲学者のみならずより広い範囲の利用者にとって有用な網羅的な参考資料の開発 |
North Carolina・Graves |
2000/2 |
1,140 |
いくつかの組織と協調して大学学部レベルでの数学の教育学習資料のDigital Libraryの構築と、それをテストベッドとして利用したDigital Libraryの利用性評価(UE) |
Swathmore College・Klotz |
2000/1 |
650 |
数学の教育と学習のためのプラットフォーム独立なソフトウェアツールのLibraryの開発(UE) |
付録2: NSDLのプロジェクト一覧
Core Integration System projects:NSDLの核となるコレクションやサービスの管理調整機能や中心となる入り口(portal)に焦点を当てたもの。
Collections projects:なんらかの分野に焦点を当ててNSDLのコンテンツの一部となるコレクションを作り上げるもの。
Services projects:NSDLの効果と効率を高め、価値を高めるために、NSDLの利用者、コレクション提供者(開発者)、システム提供者を支援するサービスを開発することを目的とするもの。
Targeted Research projects:先の3項目のいずれかに直接応用できる特定のトピックに関する研究を行うもの。
以下では、タイトル、研究代表者とその所属の一覧を示す。
Core Integration System projects