【前へ】

1. 総論

1.5  調査結果の概要

 調査報告では、下記の点に留意した。

1.5.1  ロボットの耳は2つで十分か

 ロボットが人間社会の中に入り込み、共生していくためには、混合音が扱えること、アクティブオーディション、動きながら聞く機構、未知環境での音の知覚、画像処理などのほかの処理との統合、実時間処理が大きな課題である。混合音の処理では、音源定位が重要であり、頭部伝達関数(HRTF)が使用されることが多い。しかし、HRTFは環境での音響的な伝達特性と組み合わせて使用しなければならないので、音響的な特性が動的に変化する実環境では使いにくく、HRTFを使わない手法が必要となる。そこで、これらの課題に対して、マイクロフォン2本で十分かについて考察を行い、2本のマイクロフォンで実現可能な機能について報告する。体を動かして聞くというアクティブオーディション、あるいは、画像処理とモータ処理を統合して、体全体で聞くという情報統合が重要である。そのために、方向通過型フィルタや聴覚エピポーラ幾何学、実時間処理方法を開発し、複数の実験で有効性を確認した。

1.5.2  エージェントの研究動向

 最近「エージェント」という言葉はさまざまな定義で用いられている。本報告では、プログラミング言語としてのエージェントをオブジェクト指向言語の次の技術という位置づけでとらえる。プログラミングパラダイムの変遷は、計算の世界と現実の世界を近づけるための抽象化の歴史とみることができ、オブジェクトの次に位置づけられるエージェントもこの延長上にあると考えられる。オブジェクト指向にどのような特性が加えられ、それによって何が抽象化されたかという観点でエージェントを分類し、分類ごとの研究動向や事例を紹介する。

1.5.3  人間中心の情報環境 ―感性的相互作用の視点から―

 本報告では、「人間の感性」という切り口から、「人間中心」の「人にやさしい」情報システムの実現に重要な役割を果たす、人間と情報機器・情報システムとのインタラクションに焦点を絞って、技術課題の分析と最近の研究開発の話題を紹介する。
 特に、情報提供サービスにおける利用者とデータベースとのインタラクションを、インタラクションの形態と、インタラクションを構成する要素、システムが提供すべき機能について、4つの面(感性、コンテンツ、状況、タスク)からインタラクションの特徴をモデル化する枠組みを提案する。
 感性モデルは、インタラクションの過程で、だれが、あるいは、だれのために、どのような判断基準で情報の取捨選択を行うかを定めるとともに、その人の感性的な状態(内部状態)を記述するために必要となるモデルである。
 コンテンツモデルは、インタラクションの過程で、何を情報処理や検索の対象にしているのかを記述するために必要となるモデルである。利用者の感性の違いに関係なく、コンテンツ自身の性質から情報処理の仕方や取捨選択の基準が定まる場合もある。
 状況モデルは、ある空間的な状況、時間的な状況で、情報処理の対象や、利用者とシステムとのインタラクションがどのような状況で進行しているかを記述する。同じ利用者によっても、利用者の置かれた状況が違うと、同一の操作などに対して異なったインタラクションの形態を提供する必要がある。物理的空間・情報的空間・ユビキタス的空間における状況を考えることができる。
 タスクモデルは、利用者と情報機器あるいはインターネット上で運用される情報提供サービスとが、どのような文脈で、どのようなサービスを提供するかを定義するモデルである。

1.5.4  新世代グループウェアのためのアウェアネス研究の最新動向

 グループウェア研究が一段落した1990年代になって、同期・対面環境ではあたりまえの存在感、実在感や臨場感が双方向通信(分散)環境では欠落していることに気づき、存在感、実在感や臨場感などのアウェアネスを補完する研究が勃興してきた。そこで報告者らは存在感、実在感、あるいは臨場感のアウェアネスを伝達する新世代グループウェア環境の研究開発を行った。本報告では、まず、同期・対面環境で自明の存在感、実在感、臨場感を、双方向通信(分散)環境でも伝達できる遠隔アウェアネス通信の研究の体系的サーベイを行う。次に、浅い感性を伝達する個別アウェアネス研究と浅い感性を統合するアウェアネス研究を紹介する。また、深い感性を伝達するアウェアネス研究について報告する。その結果、適切な「高品位」A-V環境を構築し、「高品位」なテキスト、手書き文字、静止画像や動画像を提供できれば、対面環境と同等あるいはそれ以上の存在感、実在感、および臨場感を伝達できるA-V環境を構築できることを実証する。

1.5.5  音声情報処理の本格的アプリケーション構築に向けての展望と課題 ―VoiceXMLを中心として―

 音声情報処理の技術に関しては、この数年間画期的な革新はなく、現在確立されている技術を用いて適応範囲を拡大していくフェーズであった。そのフェーズが終盤にさしかかった今、これまでの試みを集約した大規模で実用的なアプリケーションを構築することが、当面の目標となってきている。そのようなアプリケーションを構築するための共通の基盤として注目されているのがVoiceXMLである。本報告では、VoiceXMLを中心として、音声対話を利用した大規模アプリケーションの可能性に関する展望と課題について述べる。

1.5.6  Digital Libraries, Metadata, Interoperability

 1990年代のインターネット、WWWの発展は情報の発信と流通に大きな変化をもたらした。Digital Library(電子図書館、ディジタル図書館)はこうした背景の下に注目され、研究開発が盛んに進められたトピックの1つである。Digital Libraryのための新しい技術に関する研究開発は、アメリカでのDigital Library Initiativeをはじめとして、計算機科学、情報学分野を中心とする学際研究として進められてきた。一方、その間、図書館を中心とする現場においても、資料の電子化、サブジェクトゲートウェイ、増大する電子出版物への対応などさまざまな取り組みが進められてきている。また、ネットワーク上での情報発信と蓄積、流通を支えるには、流通する情報に関する情報をいろいろな視点から記述することが必要である。そのため、情報に関する情報、あるいは情報を表現した実体(情
報資源)に関する記述であるメタデータが注目され、さまざまな分野でメタデータの開発
が進められてきた。
 本報告では、はじめに、Digital Libraryに関する1990年代から進められたいろいろな研究開発活動を振り返って概観を述べる。ここでは計算機科学や情報学を中心とする研究開発指向の活動と、図書館を中心とする実際的なDigital Library開発、それら以外のネットワーク上での情報資源の提供と共有の取り組みについて述べる。次に、メタデータに関する概要とネットワーク上での情報資源のためのメタデータとして広く認知されているDublin Core Metadata Element Setに関して解説したあと、Digital LibraryにおけるInteroperabilityについて、メタデータの視点を中心として述べる。

1.5.7  デジタルコンテンツのトランスコーディングとインタフェースロボット

 WebページやMPEGビデオなどのデジタルコンテンツをより高度に活用するための技術として、トランスコーディングがある。今後は、コンテンツを作成する技術と、それを多目的に再利用するためにコンテンツにメタ情報を付加する技術、そして、トランスコーディングのようなコンテンツ加工・変換技術に分かれて研究・開発が進むと考えられる。もちろん、それら技術の間の相互作用も考慮するべきであるが。また、ユーザの使用するクライアントデバイスもさまざまなものが開発されていくだろう。最も一般的なものは現在の携帯電話の延長にあるモバイルデバイスであると考えられるが、それ以外にも、カーナビやテレビ、PC、PDAの発展型も依然として存在し続けると思われる。それら、さまざまなクライアントデバイスに加えて、本報告では、インタフェースロボットを紹介する。このロボットは、主に、オンライン情報をユーザに会話的に提供する。本来、書き言葉で表現された文書コンテンツを話し言葉的に変換し、さらに、ユーザの反応に応じて、さらなる情報を追加・変換していく作業もトランスコーディングの一種と言える。
 本報告では、報告者のグループで研究・開発を行っている、トランスコーディング技術およびインタフェースロボット技術について紹介する。

1.5.8  法的推論システムの研究動向と新しい展開

 本報告では、まず、法的推論の研究に関する基礎知識を簡単に説明する。次に、法的推論を実現するための主な技術課題として、法的知識の記述方法や、法的議論のモデルや、法的推論システムの構築方法論についてその研究動向を含めて解説する。さらに、今後、法的推論技術の有望な応用分野として、調停・仲裁、紛争予防、法学教育が有望であることを述べ、それらの分野で実システムを開発するには、法律の知識だけでなく、マルチモーダルインタフェース技術や、交渉技術や、教育戦略についての技術開発が必要であることを述べる。

1.5.9  音楽情報処理研究の新しい潮流

 本報告では、近年の音楽情報処理に関する新しい研究テーマを概観する。その特徴は、3点にまとめられる。それらは、音楽理論を援用し音楽の意味を考慮した処理を実現すること、応用システムをインターネット/Web上に展開すること、実現対象とするタスクが、作曲、編曲、演奏という大粒度のものから検索、模倣という中粒度のものに変化したことである。まず音楽を対象とする形式的な処理を計算機上で実現するのに有望な音楽理論を紹介し、次に、新しい研究テーマを標傍する研究事例や、関連する国際会議を幾つか取り上げる。

1.5.10  インタラクティブグラフィックスの動向

 CG技術は、映画での特撮やアニメーション制作などでの利用以外に、Webブラウザ上でのコンテンツ再生、PCや家庭用ゲームでのインタラクティブなCG映像の生成などにも応用されている。本報告では、インターネット上でのグラフィックス技術、リアルタイムCGを支えるハードウェア技術とその具体的な展開例である家庭用ビデオゲーム機の現状、さらに、インタラクティブグラフィックスの応用としてVRやAR、インスタレーションアートなどの事例を紹介し、インタラクティブグラフィックスの将来像を考察する。

1.5.11  検索履歴を用いた情報検索サポート

 Googleなどの既存の情報検索システムでは、膨大なWebページからあらかじめ生成しておいたインデックスに基づいて検索を行う。このため、異なるユーザが異なる意図を持って検索を行ったとしても、同一の検索語で検索した場合、必ず同一の検索結果が返される。しかし、ユーザが何を意図して検索を行ったかがわかれば、ユーザごとに異なる検索結果を返すことが可能となる。本報告では、このようなユーザごとに特化した情報検索をサポートする仕組みとして、従来提案されている手法を紹介するとともに、新しい手法として、同一ユーザが検索を行う際の連続する検索語の出現パターンから、ユーザの検索意図を発見する手法を紹介する。

1.5.12  Webマイニングとその将来像

 Webの拡大傾向は衰えず現在20億とも40億ともページがあると言われる。そうした膨大なWebにおけるさまざまな情報から、目的に応じた知識やその素を取り出すプロセスがWebマイニングであり、現在、大学および企業から多方面のアプローチがある。
 Webマイニングでは、Web文書のテキスト群だけでなく、ハイパーリンク関係、アクセスログ、サービスログなどWebに関するあらゆるデータが対象となる。それに応じて、統計処理、自然言語処理、リンク解析といった多彩な技術がWeb向けに拡張されてきている。
 本報告では、こうしたWebマイニング技術について、技術の概要と、実践事例としてWebの自動構造化の試み、さらに、今後の展開として次世代Web(SemanticWeb、Webサービス)とのかかわりについて述べる。

1.5.13  3次元視覚システムの技術動向と展望

 コンピュータに人間の眼と同じような視覚機能を持たせようとするコンピュータビジョンの研究は、1960年代の人工知能の研究とともに始まった。そして、研究の初期に開発された2次元の図形を認識する2次元視覚技術は、大量生産型の工程の自動化を典型例として多くの実績を挙げてきた。しかし、現在、製品ニーズの多様化に対応する多品種少量型の生産には対応できなくなっている。この問題を解決できるキーテクノロジーとして、立体を立体的に認識する3次元視覚技術があり、製造業だけでなく、多くの分野でその早期実用化が求められている。本報告では、コンピュータビジョンの歴史から最近の技術動向と課題を述べ、産業技術総合研究所で体系的に開発している高機能3次元視覚システムVVVを紹介する。最後に、視覚、人工知能、ロボットなどを統合する新世代情報処理システムへの展望を述べる。

【次へ】