杉本 重雄 委員
今のディジタルライブラリにつながる活動としてどのようなものがあったかを、1990年代のはじめに戻り、筆者の知る範囲で振り返って考えてみたい[1]。
その後、アメリカでは1994年からNSF他による共同助成でDigital
Library Initiativesが始まり、イギリスのeLibなどヨーロッパでも、インターネット上での新しい知識と情報の基盤としてのディジタルライブラリに関心が集まり、研究助成が進められた。一方、1995年には、インターネット上での重要な開発課題としてG7で認められたトピックの中にディジタルライブラリが含められ、国立図書館を中心とするBibliotheca
Universalisが進められた。
NCSA Mosaicの出現は、誰もがネットワークを利用していろいろなコンテンツの利用ができることを直感的に理解させてくれた。これは、ディジタルライブラリがどのようなものかを実感できるという意味で、ディジタルライブラリの研究開発を進める上での大きなサポートになった。90年代中ごろのインターネットの爆発的な発展で、利用者の環境が整備され、ネットワークは情報ライフラインとでも言うべきくらい日常の仕事と生活の中で利用されるようになった。こうした環境変化にともない、出版の電子化、特に学術雑誌の電子化が進んだ。現在では学術雑誌の場合、冊子体とネットワーク上でのオンライン出版を並行で行っているものが、多数を占めている。
また、インターネットとディジタルライブラリの発展とともに注目されるようになったものにメタデータがある。メタデータの定義は、単純に「データに関するデータ(data
about data)」とされる。そのため、メタデータには、利用目的によって様々なものがある。インターネット上の情報資源(Information
Resourceあるいは単にResource)の発見のために開発されたDublin Coreはインターネットやディジタルライブラリの分野ではもっとも広く認知されているメタデータ規則である。このほかにも、教育情報資源を指向したもの、電子商取引を指向したものなど、様々なメタデータ規則がある。インターネット上では、情報資源の検索、アクセス、課金、取引などネットワークを介した人間あるいはソフトウェアによるやり取りが行われる。こうした様々なやり取りを支えるためにメタデータが用いられている。メタデータの利用の広がりはメタデータの相互利用性、相互運用性の必要性をも高めている。
ディジタルライブラリ分野の主要な国際会議は、現在、ACMとIEEE Computer SocietyがスポンサーとなっているJoint Conference
on Digital Libraries (JCDL)とヨーロッパのEuropean Conference on Digital Libraries
(ECDL)がある。JCDLは前述のACMとIEEEがそれぞれ主催していた国際会議(DLとADL)が2001年から統合してできたものである。ECDLは1997年にERCIMが主催して始められたものである。アジア地域をベースにするものとして、International
Conference on Asian Digital Libraries (ICADL)がある。我が国では、1995年、97年、99年に図書館情報大学で主宰した国際シンポジウム、2000年に京都大学が英国図書館およびNSFと共同で主催した国際会議がある。ディジタルライブラリの研究分野は、データベースやWWW関連の技術を中心とする要素情報技術を総合することが求められる応用分野であり、また社会科学的な側面をも含んでいる。
[1]ディジタルライブラリに関するより詳しいレポートは平成13年度のHCIS-WG報告書,あるいはそれを基に作った筑波大学附属図書館主催の電子図書館シンポジウムのチュートリアル資料[8]を参照していただきたい。ディジタルライブラリやメタデータに関する参考資料のリストを筆者のページに置く[9]。本文中で紹介している組織や活動のページや関連論文等はそちらを参照していただきたい。
大きな流れとして、情報技術の研究開発助成プログラム、図書館によるディジタルライブラリサービスの開発、そして出版から流通に至る過程での新しいサービスの開発である。これらを概観してみたい
3.5.2.1 新しい技術の研究開発の視点を中心とした研究助成プログラム
DLIが持っていた特徴は、複数の研究助成母体による共同助成であったことと、計算科学、情報学の研究者、図書館や出版社といったコンテンツ所有者が参加するという異分野をつなぐプロジェクトであったことである。DLI-1では、NSFのほか、DARPAとNASAが研究助成母体として参加した。一方、DLI-2の場合、助成母体がNSF、DARPA、NASAに加えて、議会図書館(LoC)、人文基金(NEH)、医学図書館(NLM)に広がり、自然科学・技術分野から医学、人文・社会科学分野までカバーしている。DLI-1は、計算機科学と情報学を基礎とするディジタルライブラリのための要素技術の研究を中心に進められた。一方、DLI-2では少数の大規模プロジェクトに加えて、多数の中小規模のプロジェクトが進められた。また、DLI-2では、ディジタル資料の長期保存といった図書館の基本機能に関するものもある。
ヨーロッパでもネットワーク上での学術情報環境に関連してディジタルライブラリの研究開発が進められた。イギリスで進められたeLibプログラムは助成母体となったJISCが高等教育機関における図書館や情報環境を担当する組織であるため、DLIに比べると、図書館よりの研究が多く進められた。ドイツではGlobalInfoがすすめられた。EUでは第5および第6フレームワークの中でInformation
Society Technology (IST)プログラムが進められ、Digital Libraryに関するプロジェクトはその中に含められている。たとえば、Digital
Libraryに関する国際会議などの活動を進めているDELOS (DELOS Network of Excellence on Digital Libraries)はISTプログラムの助成を受けている。
3.5.2.2 図書館をベースにした活動
図書館におけるディジタルライブラリの開発は下記のように大きく分類できる。
(1) 電子出版物の提供
電子ジャーナルやデータベースなど、電子的に出版された資料を収集し、利用者に提供する。
(2) 既存資料の電子化と提供
図書館自身が既存資料(たとえば、冊子体資料)を電子化し、蓄積提供する。電子化の方式は、資料の種類と利用目的の違いに応じて、ページイメージ、SGML(XML)を用いた電子テキスト、OCRで取り込んだテキストとページイメージの組み合わせなどさまざまである。
原資料の保存性を高めるとともに、かつネットワークを介したディジタルコピーへのアクセス性を高めるという観点から貴重資料や歴史資料のディジタル化が進められる。また、学位論文やテクニカルレポート等の大学などの組織が発信する資料の電子化が進められている。貴重資料の場合は「保存とアクセスの両立」、学位論文等の場合は組織の情報発信とアクセス支援が基本的な目的であると言える。
(3)
ネットワーク上の資料のアクセス支援サービス
有用な資源を収集し、資源に関する情報を適切に組織化して提供する。たとえば、サブジェクトゲートウェイと呼ばれるサービスはその典型である。
WWWやメールを利用したネットワーク上でのレファレンスサービスも行われている。また、レファレンスサービスの記録の再利用を行うことも進められている。
(4) 図書館環境のハイブリッド化
従来型の資料、従来型のサービスとネットワーク型の資料とサービスを適切に組み合わせて、総合的な利用環境を提供する。
上の項目に加えて、ディジタル資料の保存が図書館での大きな関心を集めている。従来型の資料と同様に、ネットワーク上で提供されるディジタル資料を収集し、保存する。ディジタル資料の保存は、後でも述べるように、いろいろな困難な問題を多く含んでいる。
各国の国立図書館では、歴史資料や貴重資料の電子化、ネットワーク上で提供される有用な資源へのアクセス支援、納本制度に基づくネットワーク資料の保存といったことが中心的な話題である。大学図書館では、電子ジャーナルなど電子出版物の提供、貴重資料や歴史資料の電子化、大学が発信する資料の電子的提供とアクセス支援といったことが中心的な話題になっている。公共図書館でも地域資料の電子化やネットワークの利用支援などが行われる他、ビジネス支援の一環として電子資料の提供への取り組みが見られる。
3.5.2.3 新しいサービスの開発
(1) 電子ジャーナルについて
90年代の後半から、学術雑誌の電子的提供が進み、現在では非常に高い比率で電子的に提供されている。大学図書館での電子ジャーナルの提供はすでに一般化している。一方、価格の高騰や出版社による雑誌タイトルの囲い込みが進むとともに、図書館側でもそれに相対する動きがあった。ひとつはStanford大学を核としたHighWire
pressで、大学が学術雑誌の出版社と組んで電子ジャーナルの出版を進めるものである。また、SPARCの取り組みは図書館を中心とするコンソーシアムを形成し、電子ジャーナルを中心とする学術電子出版物に関する情報の共有や意見交換を進めている。
(2) 第三者による雑誌の電子化について
JSTORは雑誌の創刊号から全ページをイメージデータ化し、提供する遡及的なサービスを行っている。国立情報学研究所の電子図書館サービスNACSIS-ELSは国内の学協会が発行する学術雑誌を提供しており、遡及的な入力も行っている。こうしたサービスは、雑誌毎に完全なセットの内容を提供することができ、ネットワークを介して簡単にアクセスのできるアーカイブの役割も持っている。また、JSTのJStageのように、雑誌の編集段階から提供までの全過程を支援する取り組みもある。
(3) e-Printリポジトリについて
学位論文やテクニカルレポート、プレプリントなど、商用の流通ルートには乗らない資料を電子的に蓄積し、提供するサービスが実現されている。査読プロセスなど、雑誌論文との違いはあるが、学術論文が無料でアクセスできるという利点を持っている。しかも、査読や出版プロセスによる遅れが無いので、より早く研究成果にアクセスできる。研究成果の速報性が求められる分野では、雑誌論文は内容の保証された記録としての意味しか持たないという可能性もある。
(4) 電子ジャーナルやe-Print リポジトリの協調
電子ジャーナルやe-Printリポジトリを結ぶことによって、従来の出版形態とは異なるサービスが可能になる。例として、Virtual Journal、CrossRef、Open
Archives Initiative(OAI)といったものがある。
Virtual JournalはAmerican Institute of PhysicsとAmerican Physical Societyが出版する雑誌をソースジャーナルとして、特定分野の記事を集めて作る雑誌である。CrossRefは文献への参照により論文へのアクセスを可能にする。これらは論文や記事単位でのアクセス可能性を利用したサービスである。また、OAIはe-Printリポジトリが協調してメタデータを収集(Harvesting)できるようにすることによって、リポジトリ単位のサービスからリポジトリにまたがるサービスを可能にしている。
(5) サブジェクトゲートウェイ
社会科学や、工学、医学といった何らかの主題分においてネット上の有用な資源を収集し、それらを適切に組織化し、分類して検索機能とともに提供するサービスである。ネットワーク上の資料を提供する仮想的な図書館と考えることもできる。資源の内容の評価など、人手に負うところが多い。
3.5.2.4 ディジタルライブラリにおける課題
ディジタルライブラリの実現には様々な情報技術を総合することが求められる。その視点からは、情報技術の研究領域全体がディジタルライブラリに関連するということができる。一方、ディジタルライブラリにおけるコアな話題は何であるかを考えてみたい。JCDLやECDLといった国際会議の話題を見ると、情報技術の視点からのディジタルライブラリの研究領域が見えてくる。情報検索、情報資源の可視化、情報資源からの情報抽出といった技術要素を多様な情報資源に対して適用すること、ディジタルライブラリとしての新しいサービスモデルとそれを支える技術などがある。また、実際に「使えるのか」という観点からの評価、社会科学的視点からの研究も見られる。
NSFはDELOS(EU)と共同して、97年から98年にかけてディジタルライブラリの研究戦略を議論するワーキンググループを設けた[1]。これは下記の5つのワーキンググループからなりたっている。
(1) Intellectual Property and Economics
(2) Global Resource Discovery
(3) Interoperability
(4) Metadata
(5) Multilingual Information Access
この領域がディジタルライブラリを情報技術の観点から見た際に重要な領域であると見ることができる。
Digital Library Federation(DLF)はStrategic and Business planのレポート[2]の中で、現時点での活動項目について下記の項目を挙げている。
(1) Digital Library Architecture, Technologies, Systems, and Tools
(2) Digital Collections
(3) Use, Users, User Support, and User Services
(4) Digital Preservation
(5) Standards and Practices
(6) Institutional Roles and Responsibilities of the 21st Century Digital Library
最後の項目はDLF自身の役割について述べている。図書館における実際のディジタルライブラリサービスを構築して維持していくという観点からの中心的な話題として理解することができる。
筆者は昨年度のHCIS-WG報告[3]の中でディジタルライブラリに関する課題として、InteroperabilityとPreservationを中心に述べた。Interoperabilityは、ディジタルライブラリに限らずネットワーク上でのサービスにとって重要な課題である。また、図書館サービスとして特徴的な機能であると言えるディジタルコンテンツの保存(preservation)の問題は、技術的にも、制度的にも様々な問題を含んでいる。
DLIを進めた部門のディレクタであったY.T. Chien氏は、ネットワーク上のビジネスモデルとしてのミドルウェアが重要であると述べている[4]。WWWにおけるWeb
Servicesの取り組みは、Web上のサービスのミドルウェア化と捉えることもできる。ディジタルライブラリが本当に利用できるようになるには、ディジタルライブラリのサービスが個別の閉じた応用システムとして利用できるのみならず、ミドルウェア的に利用できるようになることが求められる。
Digital Libraryとは何かということは最近はほとんど議論されなくなったように思う。その一方、多様なディジタルライブラリサービスが提供されるようになり、我々自身も日常的にディジタルライブラリサービスを利用するようになってきた。ヴァージニア工科大学のEdward
Fox教授は、ストリームモデル(stream model)、構造モデル(structural model)、空間モデル(spatial
model)、シナリオモデル(scenarios model)、社会モデル(societies model)の5つの階層からなる5Sモデルを提案している[5]。ディジタルライブラリのための情報技術の研究開発と実際のサービスを結び付けていく上で、こうしたモデル化の取り組みが求められる。
3.5.3.1 メタデータの概観
最近、メタデータに関する話題をよく聞く。メタデータの定義は、「データに関するデータ(Data about Data)」といたってシンプルであるため、メタデータには様々な目的のものを含むことになる。メタデータは、ネット上で資源を探し、アクセスし、利用し、料金を支払う、あるいは資源を維持、管理、保存するといった様々な目的で利用される。図書館の目録や索引は典型である。衣料品についた素材の情報、出版物の知的財産権表示、テレビ番組表やビデオの内容記述などもメタデータである。ネットワークのQoS制御をメタデータによって行おうという取り組みもある[6]。このように、メタデータには様々なものがある。下に、いくつかのメタデータの例を挙げよう。インターネット上でのResource
Discovery(Dublin Core)、教育学習資源の記述(IEEE Learning Object Metadata)、 出版物の電子商取引におけるコンテンツやエージェントなどの記述(indecs)、ディジタルコンテンツのためのユニークな識別子(DOI:
Digital Object Identifier)、マルチメディア(オーディオ・ビデオ)コンテンツの記述(MPEG-7)、政府行政情報(出版物)の記述(GILS)などのほか、地理情報や環境情報など多様な分野でメタデータ規則が開発されている。また、ディジタルコンテンツの長期保存に関して、メタデータの観点からも検討が進められ、OAIS(Open
Archival Information System)のレファレンスモデルが国際標準化されている。Lagoze等が提案したABCメタデータモデルは、ディジタルコンテンツの状態の変化(イベント)に注目したものである[7]。
図書館分野では、目録や索引などのメタデータを維持管理してきた。MARC (MAchine-Readable Cataloging)を代表とする書誌データの記述形式やSubject
Heading、10進分類など統制語彙の開発も行ってきた。ディジタル資料への対応とネットワーク上でのサービスの提供のために新しいメタデータ規則の開発が進められてきた。EAD
(Electronic Archival Description) はディジタルコンテンツの記述と検索利用を目的としてSGMLを用いて定義されている。Making
of America II等のプロジェクトの経験を基礎にして、METS (Metadata Exchange and Transmission Standard)はディジタルコンテンツの記述、管理、および長期保存のためのメタデータとして開発された。MODS
(Metadata Object Description Schema) は書誌データを表すためのエレメントセットとXML上での表現を決めている。MODSは、非常にたくさんの要素をもつMARC
(MARC21) のサブセットとして定義されるとともに、XML形式としてデータ交換のために利用しやすくなっている。
World Wide Webコンソーシアムが進めるセマンティックウェブ (Semantic Web) の活動からは、現時点では、Resource
Description Framework (RDF) やWeb Ontology Language (OWL) といった話題をよく目にする。こうした技術はネットワーク上でのメタデータの流通性、共有性を高める上で、とても重要な役割を持っている。
3.5.3.2 メタデータに関する課題
メタデータに関してはInteroperabilityが基本的でかつ重要な課題であると考えられる。XML形式によるメタデータの提供、RDFの利用が進むことによって、形式的な表現上のInteroperabilityはかなり達成されると思われる。RDF
Schemaのようなメタデータ規則に含まれる記述要素や値(もしくはそのクラス)の名前とその意味の定義(メタデータエレメントの語彙定義)を行う技術を利用することで、メタデータエレメントの意味定義をネットワーク上で共有することも可能である。(すくなくとも、あるメタデータ規則のあるエレメントを一意に識別することは可能である。)このようにXMLを媒介としたInteroperabilityの基盤はできつつあると思われる。一方、応用毎に必要とされるメタデータ規則は、標準的なメタデータ規則をそのままで良い場合もあるが、いくつかの規則を組み合わせたり、応用毎の拡張が行われることが多くある。異なるメタデータ規則に基づく応用間のInteroperabilityを高めるには、メタデータ規則の中で用いられる記述要素や値の間の関係を定義することが求められる。Interoperabilityを得るためには、はじめから統一されたメタデータ規則を用いることができればよいが、それは現実的ではない。そのため、異なるメタデータ規則の下で開発されてきたシステム同士のInteroperabilityを得る方法が求められる。その場合、応用毎のメタデータ規則の持つ表現能力に比べてレベルを落としてもInteroperabilityを得るようなことが求められることになると思われる。Dublin
CoreにおけるDumb-Downの概念、OAIにおけるSimple Dublin Coreを用いたメタデータハーベスティングのプロトコルはその例である。
Interoperabilityを高める上でメタデータ規則のネットワーク上での共有が求められる。形式的なメタデータ規則の記述による人間と計算機の両者による共有が求められる。この視点から、メタデータスキーマレジストリの開発が求められる。データ項目を定義し登録するためのメタデータレジストリの国際規格(ISO
11179)も進められている。メタデータスキーマレジストリにはメタデータ規則の流通に加えて、メタデータエレメント間の関係の定義を与えることなど、メタデータのInteroperabilityを支えることが期待される。また、メタデータを利用した応用システムの開発の支援やメタデータ規則を応用する上での参考となる実践例などを提供することも有効であると考えられる。
DCMIではレジストリワーキンググループをつくり、プロトタイプの開発を進めてきている。DELOSはメタデータレジストリに関するワーキンググループを作り要求要件等に関する議論を進めてきている。ISTプログラムで助成されたSchemas
Forumプロジェクトはメタデータ規則の収集と意見交換を進めた。それに続く、CORESプロジェクトではDublin Core、MARC、ONIX、IEEE
LOMなどのメタデータ規則の開発を進める幾つかの組織から代表を招いたメタデータスキーマレジストリに関する意見交換と合意のためのミーティングを開いている。また、2003年1月にはOpen
Forum for Metadata Registriesという会議が開かれている。ネットワーク上でのメタデータの相互利用性を高める上で、異なるメタデータコミュニティの間でのメタデータレジストリの相互利用性を高めることが求められる。
また、別の視点からの課題として、メタデータに関わるコストの問題がある。情報資源の分類や抄録作成の自動化、自然言語や画像、音声理解技術を利用したマルチメディアデータの索引付けの自動化などは情報技術分野における以前からの課題である。Semantic
WebやDAMLなどの活動は、オントロジー(語彙)のレベルでの利用可能な資源が豊富にすると思われる。そうした活動の成果によってこうした分野の研究がさらに進むと期待したい。
3.5.4 ディジタルライブラリを取り巻く環境−情報環境の変化とそこで求められる技術
この10年ほどの間に我々の情報環境は大きく変化した。ディジタルライブラリとそれを取り巻く環境の変化の視点からディジタルライブラリに求められる技術について述べてみたい。
(1) 学術論文や記事の出版方法と流通経路
学術雑誌の電子ジャーナル化が進み、非常に多くの雑誌が電子的に提供されている。国内の大学図書館でもここ数年の間に電子的に提供される学術雑誌のタイトル数が飛躍的に増えた。一方、プレプリントやテクニカルレポートなど、商用の流通経路には乗らず、以前は入手に手間取っていた文献(e-Print)が、インターネット上で多く提供されるようになった。学術雑誌は査読され、編集された品質の高い内容を提供する一方、出版までに時間がかかること、雑誌の価格が高いために必ずしも多くの人の目に触れないという現実的な問題を抱えている。e-Printは一般に無料でアクセスすることができ、かつ出版までの時間がかからない一方、内容の評価は読者に任されることになる。価格の問題は図書館にとっての大きな問題であるばかりではなく、図書館を介して論文にアクセスする研究者、学生にとってとても大きな問題である。評価の高い雑誌に論文が掲載されること、数多く参照されることは研究者としての評価につながっている。仮に論文として出版される成果の多くが、論文になる前にプレプリントやテクニカルレポートとして出版されているとすると、e-Printの段階での評価を行うことができれば、これまでの学術雑誌の役割が変わる可能性がある。
また、学術雑誌の電子ジャーナル化によって、雑誌の巻や号といった単位が必ずしも意味を持たなくなり、また文献間の参照関係がハイパーリンク化できることになった。複数の雑誌の中から記事単位で取り出して作る仮想ジャーナル(virtual
journal)といった取り組みも現れている。また、CrossRefのようにオンライン出版された文献間の参照関係を結ぶサービスもある。また、有料の雑誌の場合であっても、書誌情報(タイトル、著者、キーワード、アブストラクトなど)と参考文献が無料で公開されているものも多くある。e-Printの場合は書誌情報のみならずフルテキストが公開される場合が多い。このように、論文・記事単位での情報が豊富にネットワーク上に提供されることになると、それらを利用した付加価値サービスが可能になる。Open
Archives Initiativeはそうした取り組みの代表である。OAIではe-Printを提供するリポジトリからメタデータを収集するためのプロトコル(Protocol
for Metadata Harvesting, OAI-PMH)を決め、メタデータの協調的な利用を可能にしている。メタデータを収集(Harvest)して、それに何らかの価値を付加して提供することが可能であり、これまでのリポジトリ単位でのサービスに比較して、広い範囲の資源へのアクセスが可能になることに加えて新しい付加価値サービスの可能性を持っている。たとえば、前に述べた論文や記事の評価のための基盤となる巨大な情報源となり得ると考えられる。
論文の評価のためにCitation Indexが用いられてきている。CiteSeerのようにネット上で流通する論文に関して自動的にCitation
Indexingを作ろうとするものもある。電子ジャーナルやe-Printリポジトリに加えて著者によってネット上に直接発信される論文や記事をも含めた巨大な情報源の中から、価値があると評価されるものを組織化して、利用者に提供することは学術情報を指向するディジタルライブラリにとって重要な要素であると思われる。
(2) ディジタル資料の収集と保存
電子資料の保存はディジタルライブラリにとっての重要な課題である。現在、非常に多数の資料が電子的に作られ、電子的にのみ出版されるものも多くある。現時点では、印刷物が主で電子的なものが補助的な役割を持っているものであっても、将来はその役割が逆転、ないしは電子的なものだけになる可能性もある。商用の出版ルートに乗らない学術資料や政府行政資料などはこうした傾向が強いと思われる。そのため、電子資料、特にディジタル資料の保存は将来に向けた大きな課題である。
資料の保存は、資料を利用可能な状態に保つということに加えて、保存すべき資料を収集するという面でも困難な問題を持っている。資料の保存は、「もの」として資料を保存するというだけでは不十分であり、資料の「内容」を人間が利用できる状態に保つことが求められる。したがって、CD-ROMや磁気テープを「もの」としておいておくだけでは保存とはいえない。また、インターネット上でのみ発信される資料の場合は、「もの」はなく、「内容」を保存することが求められる。
非電子資料の場合、基本的に資料が傷まないように保つことで保存することができた。ところが、電子資料の場合、利用するには資料から内容を人間が視聴できるようにするための機材が必要とされる。すなわち、資料の保存は技術の保存でもある。この点はアナログ媒体でも、ディジタル媒体でも同様である。たとえば、レコードやオープンリールのテープレコーダ、8インチのフロッピィディスクなど、以前は広く使われたのに現在はほとんど見ないものや製品が非常に少なくなったものが多くある。音や画像などの単純なデータの場合、内容を新しい媒体にコピーしなおすことで保存に適した形式にすることができる。これは紙の資料をマイクロフィルム化したり、ディジタル化したりするのと同じである。ディジタル媒体を用いた資料の場合、内容の利用にソフトウェアを必要とするもの、あるいは内容がもともとソフトウェアとして構成されているものが多くある。CD-ROMを使った辞書や教材などはそうしたものの例である。Web上のコンテンツの場合もplug-inソフトウェアを必要とするものが多くある。こうした動的な資料を保存しようとすると、ソフトウェアが動く環境、ひいては環境を実現する技術を保存することが求められる。コンピュータシステムの場合は新しいシステムに置き換える際に後方互換に関する留意がなされ、場合によってはエミュレータが用いられることもある。ディジタルコンテンツの保存に関してもエミュレーションを行う方法と、新しい環境への移植(マイグレーション)を行う方法が提案されている。しかしながら、ソフトウェアの多様性とコストを考えるとディジタルコンテンツの完全な(あるいはできるだけ完全な)保存は実現の困難な問題であることは容易に想像できる。
図書館は資料を収集し、組織化して、保存するという役割を持つ。従来、出版物の流通ルートに乗った出版物、大学や自治体など図書館が所属するコミュニティが作り出す、あるいは持つ資料を、図書館の主たる資料収集対象としてきた。ところが、インターネット上での情報発信が進んだことで、資料へのアクセスが容易になった代わりに、どのような資料を収集対象とすればよいかを決めることが大きな問題となってきた。納本制度に基づいて納本図書館の役割を持つ図書館(日本では国立国会図書館)の場合、将来の世代に現代の文化を残すという役割を果たすにはインターネット上に発信される資料を収集対象から除外することはできない。国立国会図書館の場合、CD-ROMなどの媒体に固定して流通される出版物(パッケージ系出版物)の場合は納本制度にすでに収集を始めている。しかしながら、ネットワーク上で出版される出版物(ネットワーク系出版物)については納本制度審議会で現在検討が進められている。ネットワーク上の出版物を納本制度の下に(強制的に)収集することに関する議論、あるいは知的財産権などの制度に関する議論はここでは扱わない。
図書館でのネットワーク系出版物の収集は、網羅的収集と選択的収集に大別できる。網羅的収集については、Internet Archiveが行っているように、ロボット(あるいはCrawler)による自動収集方法が適用できる。ところが図書館としてふさわしくない内容、あるいは公開することが非合法であるような内容の資料まで収集し、公開する(あるいはアクセス経路を提供する)恐れがある。一方、選択的収集の場合、内容や品質の評価に基づいて収集するため内容に関する問題は生じないが、コストが高くかつ大量の資料を集めることが困難である。内容を適切に評価し、分類する機能が必要とされている。また、電子的な文書は修正が容易に行えるのでどの時点で文書が固定されたと判断するかという問題、動的に生成される文書のように収集そのものに困難がともなうといった問題もある。
冊子体の出版物の場合、「もの」として配布されるためにどこかの図書館には残っているという期待を持つことができた。ところが、電子ジャーナルのように出版社のサーバに蓄積され、図書館が利用のライセンスしか持たないことになると資料の保存に不安を感じるようになる。第三者(公的な機関)による電子化を行っている場合、あるいは電子的保存を認めている場合は、そうした機関が保存することが期待できる。一方、スタンフォード大学で行われているLOCKSSのように、出版者の側をあまり頼らず利用者(図書館)の側で電子的なコピーを残す試みもある。
(3) 出版から利用にいたる環境の変化と図書館のビジネスモデルの変化
従来、図書館は出版者と利用者の間に位置付けられ、出版物を収集、蓄積して利用者に提供するという役割を果たしてきた。これまでは蓄積と利用の場所を提供することが図書館の付加価値として認められたのに対し、ネットワーク上では出版者と利用者が直接結びつくことが可能であるため、ディジタルライブラリの場合、従来とは異なる視点からの付加価値を提供することが求められる。大量の資料を適切に組織化して提供するという、図書館の基本的な役割は変わらないと思われる。しかしながら、次に述べるように、ネットワーク上の情報流通環境は従来のものとは異なっており、ディジタルライブラリのための新しいビジネスモデルが求められる。
学術分野では著者と読者のコミュニティはほぼ一致する。これまで学術論文の出版における投稿から利用に至る過程で、出版社、流通業者、図書館という中間に位置付けられた組織がそれぞれの間で上流(著者)から下流(読者)に至る出版物の流れを作ってきた。ところが、ネットワーク上では「もの」としての流れは意味を持たなくなる。現在の図書館が提供している電子ジャーナルのサービスは出版社のサーバへのアクセスを提供しているものが大半である。この範囲では、「電子図書館」は図書館ではなく出版社が提供していることになる。
先に述べたe-Printリポジトリの場合、リポジトリは著者と読者を直接つなぐ「電子図書館」の役割を果たしている。ヴァージニア工科大学を中心にいくつもの大学が参加して進めている学位論文のe-PrintリポジトリであるNetworked
Digital Library of Thesis and Dissertations の場合、学位論文を電子的に蓄積するためのツールの提供や著作権に関する規約を決め、学位論文の「電子図書館」としてサービスを提供している。学位論文の場合、著者によって完成されたものがそのまま公開されるという点で、出版のための編集作業を経て公開される雑誌論文とは少し異なった面をもつにせよ、学術出版物の中継ぎ役としてのひとつのビジネスモデルであると考えられる。また、OAIやCrossRefなども新しいビジネスモデルとして興味深い。
(4) コンテンツの変化とアクセス方法の変化
ネットワーク上で提供される資料と従来の出版物との大きな違いに、資料の粒度がある。図書館は基本的に出版物を単位として利用者に提供してきている。ところが、ネットワーク上での雑誌タイトルのような単位もあれば、1件の論文、あるいはその中の図表と、管理とアクセス単位は様々である。そのため、大粒度から細粒度まで、様々な粒度でのコンテンツの検索とアクセスを支援することが求められる。また、コンテンツの検索から閲覧に至る過程を統一された環境で支援することが求められる。たとえば、ディジタル化された1冊の本に関して、その知的内容に関するメタデータ、ディジタルデータの構造に関するメタデータ、アクセス権限に関するメタデータ(一部分だけがアクセス制限されることがある)といった細粒度の管理が求められる。一方、利用者の環境も様々であり、携帯電話から高精彩ディスプレイをもつ端末環境まで多様である。こうした多様性に対応することが求められる。
(5) 隣接する領域:電子政府、教育と学習
ディジタルライブラリには幾つかの主要な隣接分野がある。ディジタルミュージアムは非常に近い隣接分野である。大きな隣接分野として電子政府分野、ネットワークを利用した教育と学習の分野がある。電子政府は政府行政情報から個人情報に至るまで非常に広い範囲の情報をカバーする。多様で大量の情報資源の発信から流通、保存に至る過程で必要とされる技術はディジタルライブラリと共通するものが多い。ネットワークを用いた遠隔教育、遠隔学習は大学等での教育だけに限らず、企業での教育にとっても今後の重要な課題である。教育学習コンテンツを適切に蓄積、組織化し、共有するにはディジタルライブラリの技術が求められる。NSFが進めるNational
Science Digital Library (NSDL)では、ディジタルライブラリの基盤作りのプロジェクトから、コンテンツ作りのプロジェクトまで、多数のプロジェクトの助成が進められている。また、単にコンテンツを蓄積提供するだけではなく、コンテンツの利用方法やコンテンツを結んで作るコースウェア(これ自身もコンテンツ)等を加えていくことが求められる。こうした機能は、教育や学習に特化しないディジタルライブラリにおいても利用者環境作りの上で重要な要素である。
(6) 多様な相互運用性への期待
現在、ネットワーク上には数多くのディジタルライブラリサービスが提供されている。ネットワーク上では地理的距離とは無関係にサービスを利用できるとは言っても、いくつものディジタルライブラリを渡り歩くのは面倒である。書誌データの検索では分散横断検索のためのプロトコルZ39.50が広く用いられている。また、OAIではメタデータハーベスティングによるメタデータの共有を進めている。OAIのおもしろい点は、Simple
Dublin Coreをメタデータ共有の基礎とすることで、メタデータの記述の詳細度を落とす可能性を許すことで、異なるメタデータ規則の下に作られてきたメタデータの共有を進めている点である。個別に作られたシステムをつなぐこと、異なる語彙の下に作られたシステムをつなぐことはかなり困難を伴う仕事である。システム(あるいはサービス)間の相互運用性に関し、深いレベルから浅いレベルまでいろいろなレベルを考えることが求められる。
(7) その他
インターネット上における全てのサービスと同様にセキュリティや利用者のプライバシー、知的財産権の保護はディジタルライブラリにとっても非常に重要な話題である。インターネットの自由度や利便性と安全性を同時に得ることは必ずしも容易ではない。たとえば、現在、国立国会図書館では法定納本制度に基づくネットワーク情報資源の収集に関する議論が進められているが、収集対象となる資料の性質の問題と収集のための技術の問題に加えて、従来の制度ではカバーしきれない点も指摘されている。ディジタルコンテンツの場合、簡単にしかも細粒度でのコピーができ、知識や情報の再生産が行いやすい反面、著作権の保護が問題になる。ディジタルライブラリのパーソナル化サービスが進められているが、従来図書館では個人情報の保護は思想信条の自由の下に最も重視されてきたことのひとつである。こうした相反する要求を満たすための制度とそれを支える技術の開発が求められる。
3.5.5 おわりに
WWWとMosaicによるインターネットの大爆発から10年近くが立とうとしている。この数年の間に、電子ジャーナルをはじめ図書館現場でのディジタルライブラリサービスはずいぶん進歩したと感じる。利用者の情報環境とそこでの行動はこの間にずいぶん変化した。「電子図書館というと古い資料を電子化してネット上で見られるようにすることですか」という認識はかなり減ったように思える。これは、電子ジャーナルをはじめ、図書館で提供されるコンテンツが増え、ディジタルライブラリサービスが進歩したからであろう。また、「電子図書館ができると本や図書館はなくなるのですか」という質問もほとんど聞かなくなった。紙の本と同様な使い勝手(大きさ、軽さ、耐久性など)を持つ出版媒体が出てくるまで、紙の本がなくなるとは思えないので、この質問に対しては「そんな心配はないですよ」と答えることにしている。
図書館の機能、すなわち情報を必要とする人に適切な情報を提供することは社会の中のどこにでも組み入れられている。「図書館」という名前で呼ばれなくてもそうした機能を持っている組織は多くある。インターネット上でのサービスのミドルウェア化が進むとすれば、ディジタルライブラリも同様にミドルウェア的に利用できるようになる必要がある。大きなサービスを提供するソフトウェアシステムを構成する一部として組み込まれる完全自動のディジタルライブラリも出てくるであろう。一方、ディジタルライブラリにはエンドユーザ向けのサービスを提供する、いわば応用システムとしての役割のみならず、様々なサービスの影で働くミドルウェア的な役割を演じることも求められると思われる。そうしたばあい、人間をも含めて構成される社会システムの中でのミドルウェア、いわば社会的ミドルウェアとしての役割が求められるのであろう。
「理想の電子図書館」では本も雑誌もビデオもすべて電子化され、図書館員との対話や図書館でのイベントにもネットワーク経由で参加でき、「館」に行くのと同水準のサービスが受けられるようになるべきなのであろう。また、ことばの壁を越えて、ビデオデータであろうと、新聞記事であろうと、あるいはホームページであろうとメディアの違いを超えて、利用者に適切な情報を提供することができるのが「理想の電子図書館」なのであろう。その意味からは「理想の電子図書館」はまだ近くにきているとは思えず、今後もチャレンジすべきものであると思える。
最後に、筆者にとって人間主体の知的情報技術に関する調査研究ワーキンググループから得られる情報や議論は非常にありがたいものであった。こうした機会を下さった先端情報技術研究所の内田俊一所長、本ワーキンググループの奥乃博主査(京都大学大学院情報学研究科・教授)をはじめとして、先端情報技術研究所の皆様に感謝の意を表したい。
[1] | Schauble, P., Smeaton, A.F., (eds), “An International Research Agenda for Digital Libraries ? Summary Report of the Series of Joint NSF-EU Working Groups on Future Directions for Digital Libraries Research”, http://www.iei.pi.cnr.it/DELOS/NSF/Brussrep.htm, 1998.10 |
[2] | Greenstein, D., “Digital Library Federation, DLF strategy and business plan”, 2000.9, http://www.diglib.org/about/strategic.htm |
[3] | 杉本重雄,”Digital Libraries, Metadata, Interoperability”, http://www.icot.or.jp/FTS/REPORTS/H13-reports/H1403-AITEC-Report3/AITEC0203R3-html/AITEC0203R4-ch3-6.htm, 2002.3 (これをもとに加筆したものが筑波大学附属図書館・電子図書館シンポジウム報文集にある。http://www.tulips.tsukuba.ac.jp/pub/dlsympo/tutorial.pdf) |
[4] | Chien, YT., Whither digital libraries? The case of a "billion-dollar" business, 筑波大学知的コミュニティ基盤研究センター研究談話会資料,2002.11 |
[5] | Goncalves, M.A., Fox, E.A., “5SL: a language for declarative specification and generation of digital libraries”, Proc. Of JCDL2002, pp.263-272, 2002.7 |
[6] | DC-2002の二つの論文(Atarashi, R., 他, “Policy Control Network Architecture using Metadata”, Kawarasaki R., Kishigami.J., “Metadata associated Network Services and Capabilities”, http://www.bncf.net/dc2002/program/social.html#posters, 2002.10) |
[7] | Lagoze, C. and Hunter, J., “The ABC Ontology and Model, Journal of Digital Information”, vol.2 issue 2, 2001.11, http://jodi.ecs.soton.ac.uk/Articles/v02/i02/Lagoze/ |
[8] | 杉本重雄, “電子図書館−概要と課題−”, http://www.tulips.tsukuba.ac.jp/pub/dlsympo/tutorial.pdf, 2003.1 |
[9] | 杉本重雄, “Digital Libraryに関する参考資料リスト”, http://avalon.ulis.ac.jp/~sugimoto/References/ |