情報システムの歴史の中でも現在は大きな転換点になるのではないかという予感がある。「インターネット」と「マルチメディア」の2つが最近の大きな流れとなっている中で、この2つの流れが将来の情報システムを大きく変えていくのではないかということは容易に予測できる。しかし、この2つの流れを踏まえて情報システムの将来がどうなっていくかの明確なビジョンは確立されていない。
本稿のテーマである「ネットワークとデータベース」という分野は上記の2つの流れと密接に関連し様々な研究開発が行われておりその将来の予測は研究開発動向の分析だけからは困難である。そこでネットワークとデータベースを広い意味で考えることにより、将来の情報システムについて考えてみたい。情報システムは単体コンピュータの定型的利用から分散化・機能の高度化などが行われ、様々な応用に用いられるようになっている。最近のモバイルコンピューティングなどもネットワーク技術の中に位置づけることができる。一方、広い意味でのデータベースと情報管理・利用の分野は情報システムの変遷の中で将来はますます重要になっていくと考えられる。
上記のような観点から情報システムの最近の動向を見ると将来のシステムは4つのAと2つのS(4A2S)で特徴づけられるのではないかと考える。4つのAとはAnyone(誰でも)、Anything(なんでも)、Anytime(いつでも)、Anywhere(どこでも)である。ここでAnything(なんでも)はAny information(どんな情報でも)と置き換えても良いし、Anywhere(どこでも)は(どこにあっても、どこにいても)の2つを同時に意味していると考えることができる。これに対し2つのSは Simple and Speedy(簡単で迅速に)である。したがって、4A2Sは1つにまとめると「いつでも、どこでも、だれでも、なんでも、簡単で迅速に、情報が利用できる」ことを意味している。このように書くとあたりまえのようだが、現状の情報システムは種々の制約により4A2Sが実現されているとは言い難い。しかし、ネットワークとその利用技術の発達と情報のマルチメディア化の流れは確実に将来の4A2Sの実現に向かっていると考える。したがって、情報システム技術の研究開発を4A2Sの実現という観点から分類や検討を行うことができる。本稿のテーマであるネットワークとDBは4A2S情報システムの実現という観点から見ればまさにその中核となる技術と考えて良い。
4A2Sを将来の情報システムの実現すべき特徴と考えたとき、ネットワークとデータベースに関連する研究分野はこれらのAまたはSを実現の観点から捉え直すことができる。そしてそれら技術の延長上に4A2S情報システムを展望することができる。しかし研究開発においては4A2Sのような抽象的な表現よりはもう少し具体的なシステムイメージを描くことが必要である。ここでは4A2Sを実現するシステムとしてマルチメディア情報ベースを考えたい。マルチメディア情報ベースは世界中に存在する各種のメディアで表現された情報を任意の場所から柔軟に検索・利用を可能とするシステムである。マルチメディア情報ベースを実現するためには関連する技術のレベルアップだけでなく統合が必要である。また、マルチメディア情報ベースは将来の情報システムの中核部分となるものであり、その研究開発を通じて情報システム技術全般の向上が可能となる。
ネットワーク環境におけるデータベース技術は分散データベースやオンラインデータベースなど長い歴史がある。分散データベースはコンピュータネットワークに接続された複数のサイトにデータベースを分散配置し、処理効率の向上や障害対策などを図ったシステムである。分散データベース機能はすでに多くの商用データベース管理システムで実装されている。分散データベースを発展させたシステムとしては複数の異なったデータベースを管理するマルチデータベース、異機種分散データベース、連邦データベースなどとよばれるシステムがあり技術的には一定の水準に達している。オンラインデータベースはネットワークを利用した情報検索システムであり、文献情報検索や各種の情報提供サービスとして利用されている。データベース管理と情報検索の両分野は共通事項も多いが、利用形態が異なるため別々の研究分野と考えられる場合が多かった。また、データベースの更新を高速で行う必要がある応用に向けたシステムはオンライントランザクション処理システムと呼ばれ別の分野として扱われることも多い。また、電子図書館はデータベースと密接に関連しているが、これについては別項で詳説される予定である。
最近のインターネットの普及に伴い、データベース管理技術と情報検索技術の両分野にまたがる様な研究や、新しいメディアを扱うための研究が盛んになっている。新しい分野としては様々な情報源を統一的に扱ったり、大量のデータから知識を発見したりする研究などAI技術と関連の深いものが多い。一般の情報処理技術者や利用者の間で話題となった分野としてはマルチメディアデータベース、データウェアハウス、データマイニングなどがある。また、ウェブデータベースという呼び方をする場合が有るようにWWWも広い意味でのデータベースと考えることができる。従って、最近はWWWやそのブラウザなどの関連ツールを踏まえた研究開発が盛んになっている。ネットワークとデータベースに関連する最近の話題には以下のものがある。
インターネットとデータベースに関してはWWWブラウザからのデータベース検索やウェブ検索サーバーなどがすでに実用化されている。しかし、これらの機能は比較的単純なレベルにとどまっており、各種情報資源の有効利用や、データベース機能をインターネット環境で十分に発揮するような形態とはなっていない。モバイルデータベースではクライアントが頻繁に移動する環境でのデータベースの管理がもっとも重要であるが、サーバーの移動なども考慮したモバイルコンピューティング環境でのデータベースの役割の変化なども問題になっている。これら2つの分野では基本的な情報アクセス機能以外はまだ十分研究されていない。これに対し異種情報資源の統合利用ではDBMSで管理される構造化データや、ウェブやSGML文書などの非構造データを統合的なインタフェース、例えば問合せ言語で利用可能とすることが主な課題である。このテーマは様々な角度から研究されているが、インターネット環境での種々の情報の有効利用を行うためには不可欠な課題である。また、これらと関連した開放系での問合せ機能の研究開発では従来のマルチデータベースの様にあらかじめ定められたサイトだけでなく、任意のサイトへの自由な問合せを実現することを課題としている。問合せ機能では属性などの構造情報が利用でき必要情報だけを送ることを指示できるので、WWWでのキーワード検索より精度の高い検索が可能である。マルチメディアのサポートではマルチメディア情報の検索や表示が主な課題である[1、2]。研究開発課題としては画像・映像の内容検索やその基礎となる時間的・空間的なデータ記述のためのデータモデル、分散ビデオサーバーなどがある。内容検索は技術的にはかなり進展しているが実用化にはまだまだ問題が多い。データ構造や高速化技術はデータベース分野では古典的な課題であるが、新しいメディアやハードウェアの導入に伴ってこれらの技術の見直し・改良も進んでいる。マルチメディア情報ベース実現の観点からこれらの技術の現状を考えるとマルチメディア内容検索技術はまだ制約が多く技術的なボトルネックになる可能性がある。したがって、マルチメディア情報にテキスト情報を付加する従来の方法の併用が必要になる。この関連で注目されるのが本報告書の別項にある「大域文書修飾」の方法である。この方法を拡張して通常の文書だけでなくマルチメディアデータにタグを埋め込むような拡張を行うことにより、マルチメディア検索の機能と性能を向上することが期待できる。
ここまでのテーマは4A2Sの各要素との関連が比較的明確であるが、以下のテーマは直接的な関連はあまりないかもしれない。情報源の交渉/協調機能は各種の高度なデータベース応用のためにデータベースなどの情報源に知的な処理を導入するアプローチである。データマイニング/知識発見では大量のデータの中から意味のある情報をどのようにして得るかが課題である。汎用的な方法も各種研究されているが、ドメインによって方法を使い分けたり、ドメイン知識を用いる方法が有効である。重要なデータほど企業秘密とされる傾向があるため、重要な研究内容が必ずしも発表されない場合が有る。CSCWのためのデータベースは重要なテーマであるが、CSCW研究の一環として作業環境や作業手順との関連を重視する必要が有り、リポジトリのように独自の領域として成長していくと思われる。この他の新しいデータベース応用としては教育や地球観測(EOSDIS :Earth Observing System Data and Information System)、エレクトロニックコマース、健康管理システム、電子出版などがある[3]。
米国の情報技術に関しては本研究所で一昨年度調査を行った[4]。研究開発分野は5つに大分類され情報管理はその1つとなっている。情報管理分野には情報管理システム、データベース設計と管理、検索言語、等が含まれる。この分野では90年代に入って、政府の出資を受けることが難しくなっている(本調査によれば情報技術分野の資金の内情報管理分野の割合はあまり大きくなく減少傾向にあると推測されている)。その中で比較的ホットなのはインターネットとの関連の部分である。具体的には「分散マルチメディアデータベース」と「マルチメディア情報検索」がある。
分散マルチメディアデータベースはHPCCのデジタル・ライブラリ・プログラムの中で取り上げられている。このプログラムでは分散した各種の情報をネットワークでどこからでもアクセス可能とすることが課題であり、あらゆる情報が対象となる[4]。これは前節で異種情報資源の統合利用と述べたテーマに対応している。従って、図書館の電子化を主な課題とする日本の電子図書館プロジェクトと比較して対象領域が広い様に思われる。ただし、個々のテーマでは図書館への応用を意識したものが多い。また、米国ではもう一つの流れとして公共/大学図書館を中心に行われているデジタルライブラリ研究があり日本のものに近い。
マルチメディア情報検索ではマルチメディア情報の検索や表示が主な課題である。マルチメディア情報の扱いは以前から情報管理/データベースの重要な課題であるが、最近のマルチメディア技術の発達によりますます重要になってきた。本委員会でも電子美術館やヒューマンメディア技術などでマルチメディア情報の検索の重要性が議論された。
欧州の研究開発プログラムの代表であるESPRITでは情報技術分野はソフトウェア技術、部品とサブシステム技術、マルチメディアシステムの3つに大分類されている[5、6]。ソフトウェア技術は4つのテーマに分類され小分類として34のタスクがあるが、そのうち10のタスクがテーマ3の「分散システムとデータベース技術」に属している。これらのタスクは分散システムのモデリングと開発、インターオペラビリティ、分散システム管理」、ミドルウェア、情報インフラ、高性能分散DBMS、統合DBS、DBMSの機能拡張、DBS応用のための環境、情報への直観的アクセスである。また、大分類のマルチメディアシステムには12のタスクが有り、「マルチメディア記憶と検索」の様にデータベースと関連の深いタスクが含まれている。このようにEspritではデータベースは分散システムやマルチメディアシステムと密接に関連する分野と位置づけられ研究が行われている。
日本ではかつてインターオペラブル・データベースの研究開発プロジェクトがあったが、これは技術的には分散/マルチデータベースに対応するテーマであった。また、第5世代コンピュータプロジェクトにおける知識ベースの研究開発は知識処理とデータベースの統合を目指すアプローチを取っていた。最近ではいくつかの電子図書館プロジェクトがある。大学関連では平成8年度から科学技術研究費重点領域研究として「メディア統合及び環境統合のための高機能データベースシステムの研究開発」(略称:高度データベース)が開始された。ここでは「高度応用のための情報ベースモデルとその実現技術」、「マルチメディア情報ベース技術」、「分散発展型データベースシステム技術」、「協調能動型データベースシステム技術」の4班で研究が行われており、前節で述べた研究テーマの大部分に関連する研究開発が行われている。これらの研究の中には電子図書館に有用な技術もかなりあると思われるが、図書館への応用を目指した研究は明示的には行われていない。
ネットワークとデータベースに関連するわが国の研究開発は産業界を含んだものとしては電子図書館プロジェクトが関連するが、それ以外にはいくつかのプロジェクトで副次的に取り上げられている程度である。それに対し米国ではディジタル・ライブラリ・プログラムが日本の電子図書館プロジェクトと比較し広い視野で情報資源の問題を捉えているのをはじめ、情報管理が情報関連の5大分野の1つに位置づけられるなどかなりの政府資金が投入されている。また、欧州のEspritでもデータベース技術が情報技術の中でも重要な技術の1つとして位置づけられている。情報管理/データベース技術は情報インフラの重要な構成要素であり、情報産業の振興のためにより積極的な取り組みが望ましい。
本分野のプログラムとしては情報管理やデータベース一般をテーマとする案ともう少し焦点を絞った形にする案の両者が考えられる。一般的なテーマでのプログラムとする場合はEspritと同様に主な技術課題といくつかの応用をあげ総合的な研究開発を行う。しかし、このようなプログラムは情報技術一般にかんするプログラムができてその一環として実施するのでなければ困難であろう。これに対しより明確な目標を掲げたプログラムの方が実現が容易で効果がある。このようなプログラムの候補として前述の「マルチメディア情報ベース」を考えたい。マルチメディア情報ベース(MIB)は世界中に存在する各種のメディアで表現された情報を任意の場所から柔軟に検索・利用を可能とするシステムである。MIBにより4A2Sを具体化するシステムが実現できると同時に、将来の情報システムの中核技術の研究開発を行うことができる。
MIBを実現するためには関連する技術のレベルアップだけでなく統合が必要である。また、技術開発だけでなく応用システムを開発し実用性の検証と改良のための検討を並行して行っていく必要が有る。MIBの研究開発に関連する要素技術の主なものを以下にあげる。
MIBの研究開発において重要なのは個々の要素技術の研究と同時にそれらの技術を有機的に統合して実験的な応用システムを実現することである。この観点からはテキストや数値情報の処理技術ははMIBの基礎として使用可能な段階に有るが、マルチメディアデータのサポートについては現在の技術では不十分である。このため、マルチメディア検索などの技術の研究開発が重要であり、従来技術の延長だけでなく新しいアプローチも必要になると思われる。従来の技術ではマルチメディアデータにテキスト情報を別に索引として持たせるか、マルチメディア情報自身の内容検索が中心であるが、これらだけでは十分な機能を持ったシステムの実現は困難かもしれない。また、マルチメディア情報を対象とした情報統合についてはまだあまり研究されていない。
ここで注目されるのがテキスト情報をマルチメディア情報に埋め込んで行くタグ付け(文書修飾)技術である。タグ付けは例えばニュースのシーン記述や写真のキャプションなどをデータそのものに埋め込むことで検索などの情報利用を容易にできる。マルチメディアデータのデータベース化や各種の情報の電子化時にタグ付けを行い、タグつきデータを流通させることにより情報の高度利用ができる可能性もある。タグ付けは内容を理解する必要が有るので当初は人手で行うが、並行して音声認識や画像認識による自動タグ付けの研究を行うことにより将来は半自動的なタグ付けを行うこともできる。MIBの研究開発ではタグ付けが重要な役割を果たすので、マルチメディア情報のタグ付けとその応用の研究が重要である。また、技術開発だけでなく情報の収集とタグ付け、すなわちコンテンツが非常に重要となるのでコンテンツ作成の支援も必要である。
MIBの応用としては地域経済の統合情報システム(企業情報、交通網などの地図データ、住民関連情報、物流情報など)や防災情報システム(危険物の所在、警察・消防の情報、避難情報、食料情報など)など情報が1つの機関だけではなく複数の機関に散在し、総合的な情報利用が困難な分野が考えられる。
<参考文献>