人間主体の知的情報技術に関する調査研究VI

1.3 　人間主体の知的情報技術の研究調査の概要

1.3.1　アウェアネス技術の動向の概要

國藤　進　委員

　分散環境でも対面環境と同様なアウェアネス（気付き）を提供するアウェアネス技術がCSCW(Computer Supported Collaborative Work)、グループウェア研究者に注目されている。本報告では、この分野の代表的国際会議であるCSCW2002でのアウェアネス技術およびその周辺技術の研究発表を中心に、この分野の研究開発動向を述べる。アウェアネス技術がモバイル技術、センサー技術と統合し、「いつでも、どこでも、誰でも」対面環境にいるのと同様な雰囲気、熱気、視線等をアウェアできる環境の構築研究の裾野が広がっていることを紹介する。

1.3.2　次世代Webとエージェントの概要

大須賀　昭彦　委員

　WebサービスやセマンティックWebなど、機械がWebコンテンツの意味を理解した上で処理することを可能にする、新しいWebの世界を目指した研究が進められている。次世代Webと呼ばれるこの新しいWebの世界では、人間の代理人となってWeb上のさまざまな仕事を処理するソフトウェアエージェントが重要な役割を果たす。そこで、この章では、エージェント技術研究の最新動向をサーベイした後で、WebサービスやセマンティックWebなどの次世代Web技術とエージェント技術との関わりについて触れる。また、エージェント技術をWebサービス分野に応用した具体事例として、Webサービス向けマッチメーカーを紹介する。

1.3.3　IT技術の法への応用の概要

新田　克己　委員

　IT技術の発達により、法律分野では教育方法、および、紛争解決方法に大きな変化がおきている。法学教育においては、メディアを使った法学教育の例として、遠隔地からも学習できる模擬法廷システムや、パソコンを利用し、学生と教官がインタラクティブに情報を交換しながら講義を進める実験的な教育システムを紹介する。紛争解決方法においては、オンラインの法律相談、調停、仲裁システムについての内外の研究動向や、実用化に向けての問題点を紹介する。

1.3.4　ＷＷＷサーチエンジンの最新技術の概要

山名　早人　委員

　2002年末時点で約70億ページと推定され、かつ、年率100％の勢いで増加を続けるWebページの中から自分が必要とする情報を見つけ出すためには、Googleに代表されるWWWサーチエンジンが必要不可欠となっている。しかし、Googleが検索対象とするWebページ数は、2002年末時点で約31億ページであり、世界中の全Webページを対象に検索することはできない。また、WWWサーチエンジンに入力されるキーワードは平均２語であり、２語という限られた情報を用いて、ユーザが欲するWebページを見つけ出すことは、一般的に困難である。このような問題に対して、WWWサーチエンジンは、①膨大なWebページの効率的な収集とインデックス化、②検索結果のランキング、という２つの重要な技術を利用している。本報告では、これらの技術について最新動向を報告する。

1.3.5　ディジタルライブラリとメタデータ‐ 概要と課題

杉本　重雄　委員

　本報告では、はじめに簡単にディジタルライブラリの研究開発を振り返った後、ディジタルライブラリとメタデータに関する概観と将来への課題に関して述べる。最後に、コンテンツの保存や相互利用といったディジタルライブラリにおける幾つかの基本的課題について述べ、ディジタルライブラリの位置付けを試みる。
　ディジタルライブラリの研究開発活動は、Digital Library Initiativesに代表される新しい情報技術指向のものと図書館を基礎にした活動に大別される。また、ネットワーク上での情報蓄積と流通の発展がディジタルライブラリに大きな影響を与えている。こうした活動を通じて、ディジタルライブラリにおけるInteroperabilityの問題、ディジタルコンテンツの長期保存の問題といった、これからのディジタルライブラリにとっての中心的な課題が浮き上がってきている。
　メタデータはディジタルライブラリに限らずインターネット上でのコンテンツやサービスの流通に重要な役割を果たすことが認められている。また、ディジタルライブラリサービスが、情報資源の検索やアクセス支援という付加価値であるという視点からは、メタデータは価値の付加を実現する上での中心的なものであるともいえる。インターネット上では目的に応じて多様なメタデータ規則が提案されている。実際にそれらを応用するには、それらを目的にあわせて適用することや、複数の規則を組み合わせて利用することも求められる。こうした多様性を認める必要がある一方、メタデータ間のInteroperabilityを高めることが重要であることもみとめられている。草の根的に応用システムやサービスが作り上げられていくインターネットにおいて、異なる規則でつくられたメタデータ間の相互利用性を高めることはこれからの重要な課題である。
　インターネット上での情報発信や電子出版が一般化し、ディジタルライブラリはすでに現実のサービスともなっている。一方、そこで実際に提供されている機能と、期待された機能との間にはまだギャップがあるといえる。また、コンテンツのディジタル化によって新たに出現してきた問題もある。ディジタルコンテンツの収集と保存、コンテンツの細粒度化によるサービスの変化など、いろいろな問題が残されている。

1.3.6　セマンティック・トランスコーディング-より実用的な“Semantic Web”に向けて-の概要

長尾　確　委員

　次世代の高度な知識共有のインフラであるSemantic Webに不可欠なものは、ユーザが自由にコンテンツを作成し、さらにその共有化を促進し、知識として再利用可能にするためにコンテンツを意味的に拡張するツールやプラットフォームである。われわれは、これまでセマンティック・トランスコーディングという枠組みにおいて、現在のWeb の若干の延長線上に、Semantic Webと同等の機能を有する仕組みを研究してきた。それは、主に以下の3つのシステムから成っている。

1. 既存のWebコンテンツに対して、機械による内容理解を促進する補足情報(アノテーション) を付与するツール
2. アノテーションデータを管理・共有するためのサーバ
3. アノテーションデータを用いてコンテンツを動的にユーザに適合させるためのトランスコーディングプロキシ

　これらのシステムを実現した経験に基づいて、Semantic Web の早期実現のために、近い将来に、われわれが何を、どのように行うべきか、に関する一つの提言を行う。また、動画コンテンツに対するアノテーションとそれを用いた応用についても述べる。

1.3.7　多感覚情報のデータベース化と情報サービスへの応用の概要

加藤　俊一　委員

　多感覚を用いた情報通信・情報サービスの基盤技術として、多感覚を用いたヒューマンインタフェース、多感覚の情報のデータベース化、多感覚の情報の内容に基づく連想・検索の技術の必要性が高まっている。
　本稿の範囲で扱う「感性」とは、人間が実世界のさまざまな事物に接した時に、どのようにセンシングし、これを類型化し、どのような概念のイメージや主観的な評価と結びつけるかの過程をいうものとする。
　感性をモデル化する場合、従来は、あるメディアのコンテンツを対象に、それぞれのコンテンツごとに、かなりの数の教示用データを利用者から得て、統計的学習を行っていた。従って、利用者（被験者）の心理的身体的負担は大きく、感性のモデル化技術を応用する上でのボトルネックとなっていた。また、人間は多感覚を利用して人とコミュニケーションを行っているが、１つの感覚を分析・モデル化し、ヒューマンインタフェースに応用している研究がほとんどであり、システムの開発は非常に個別的・限定的に行われている。このような現状をブレークスルーして、感性情報技術（本来は応用分野に横断的な技術である）を汎用性・一般性のある技術として確立し、モノ作りやサービス、ヒューマンコミュニケーションなどの様々な場面で利用可能とする新しい枠組みが必要となってきているのである。
　本稿では、現行のモデル化の枠組みを踏まえながら、感覚情報の幅を視覚・聴覚・触覚・味覚・嗅覚の五感に拡大するとともに、より精密な感性のモデル化を行う上で重要な視点を整理して検討する。

1.3.8　感性のモデル化技術とＥコマースへの応用の概要

加藤　俊一　委員

　検索技術の向上により、膨大な商品群の中から自分が購入したいと考えている商品を検索することは、ある程度可能になった。しかし、「何かいいものがないかな？」というようにウィンドウショッピングするような感覚で、自分が興味を持ちそうな商品を探し出すのは、非常に大変である。しかし、「自分の興味の対象になりそうな商品の情報が欲しい」という思いは、消費生活の上では非常に基本的な要求である。このような要求に対して、消費者の主観的な商品の選択基準をモデル化することができれば、消費者ごとに興味を持つ可能性のある情報を適切にレコメンドすることができる。そうすることで、消費者は自分の選択基準にあったより多くの情報に触れることができる。
　本稿では、電子社会時代に、市民生活に最も近いBtoC (Business to Consumer)型の電子商取引（Ｅコマース）として、商品情報のレコメンデーションシステムを取り上げ、これを実現する上での技術的課題を考察する。

1.3.9　テレイマージョンとビジュアルデータマイニングの概要

宮田　一乘　委員

　CG技術の進歩とネットワーク速度の高速化にともない、地理的に離れた空間をコンピュータとネットワークで構成される仮想空間内で統合する、テレイマージョン（Tele-Immersion）の研究が現実味を帯びてきた。一方で、大量の画像データの中から意味のあるデータを発掘するビジュアルデータマイニングの研究は、バイオサイエンスや気象学などにおける多元解析のツールとして、今後重要度が増すと考えられる。本報告では、これらの技術動向に加えて、テレイマージョンの環境下で、協調しながらビジュアルデータマイニングする手法なども紹介する。

1.3.10　昨今の音楽情報処理における研究プロジェクトについての概要

平田　圭二　委員

　本稿では、昨今の新しい音楽情報処理研究の流れを象徴するような国際的研究プロジェクトを5つ紹介する。
　昨年の報告書では、新しい音楽情報処理研究の特徴は、(a) 音楽理論を援用し音楽の意味を考慮した処理を実現すること、(b) 応用システムをインターネット/Web上に展開すること、(c) 実現対象とするタスクが、作曲、編曲、演奏という大粒度のものから検索、模倣という中粒度のものに変化したことの3点であると述べた。これらを念頭に置いて、今年3つの音楽情報処理関連の国際会議に参加した。得た所感は以下の通り。
　(a) の試みは地道に続けられている。論文はある程度の件数発表されているものの、決定的なブレークスルーには至ってないようだ。現在、確立しつつあるサブ研究分野としては、メロディ分割、メロディ類似度、楽曲構造分析、声部分離、演奏表情分析/合成、音楽データベースのインデキシングなどがある。
　(b) に関しては実際に多数の事例を見出すことができたが、アプリの動作環境としてモバイル端末を想定したものも発表されていた。例えば、ユーザの嗜好を反映したplaylist (ラジオ局やレコード店の推薦盤/曲リストのこと) の自動作成が目を引いた。
　(c) に関しては対象タスクが中粒度に変化しただけではないように感じた。音楽情報処理におけるタスクは大きく生成系 (制作系) と認識系に分類できるが、現在注目されているのは中粒度でかつ認識系のタスクである。信号レベルのパターン認識技術に限定し、(a) のような意味レベルまで踏みこまなくとも、有用な商用アプリケーションが組めるのではないかという実績と期待の反映である (これは、昨今の統計的自然言語処理の隆盛を連想させる)。また、生成系 (制作系) に敢えて取り組まないことで、他分野の研究者の参入が容易になり、一般の人でも利用可能な音楽システムの研究開発であることがより明白にアピールできるため、研究リソースが集まってきている。
　現在欧米では、上述した音楽情報処理の新しい研究の流れを象徴するような研究プロジェクトが、NSF、FP5 (FP6) 等から支援を受けて進行中である/あった。本報告では、その中からOMRAS、CUIDADO、WEDELMUSIC、MUSICNETWORKS、SALIERI/GUIDOの5つを取り上げ紹介する。

1.3.11　次世代音声認識の手法と実用化の動向の概要

児島　宏明　委員

　現在の音声認識は、HMM（隠れマルコフモデル）と統計的言語モデルに基づく手法が主流となっており、その枠組み内では技術的にほぼ確立されている。本報告では、これに代るような次世代の音声処理手法に関して、認識アルゴリズムを中心に概観し、位置づけと方向性をまとめる。また、このような音声処理技術の応用に関して、これまでに、認識対象語彙の拡大や認識精度の向上などの改良が進められてきたにもかかわらず、現在のところ、広く普及し利用されるには至っていない。ここでは、普及の鍵となる要因について、小型化と低価格化を中心に検討し、その事例を紹介する。

1.3.12　アクティブオーディションを利用したヒューマンロボットインタラクションの高度化の概要

中臺　一博　講師

　近年、ヒューマノイドを中心にロボットが注目されている。この延長線上には、将来、ロボットが人間社会で人と共生し、ソーシャルインタラクションを通じて、パートナーとしての役割を果たすことへの期待があろう。しかし、現状のロボットは、そうしたソーシャルインタラクションを可能にするほどロバストな知覚処理は難しく、その中でも特にロボットの聴覚処理には多くの課題が残されている。
　そこで、本報告では、ロボット聴覚機能を実現し、自然なヒューマンロボットインタラクションを実現するため、アクティブな動作を聴覚と統合し聴覚を向上するアクティブオーディションを提案する。また、視聴覚情報の統合による知覚向上、一般的な音(混合音)の理解も同時にロボット聴覚には本質的であると捉え、これらを考慮したロボット聴覚システムの提案および工学的な実装を行う。
　構築システムは、ロボット動作時のノイズをキャンセルすることで、アクティブな動作の利用を可能とする。また、視聴覚を統合することにより、複数の話者定位・追跡を行う機能と注意を向けた方向の音源を実時間で抽出するアクティブ方向通過型フィルタによって音源分離・分離音の音声認識を行う機能を有している。これらを通じて、ヒューマン・ロボットインタフェースとしての有効性を示す。

【次へ】

1.3 人間主体の知的情報技術の研究調査の概要

1.3 　人間主体の知的情報技術の研究調査の概要