平成7年度 委託研究ソフトウェアの中間報告 |
(1) EDR辞書に含まれる形態素間の接続表の問題点の抽出と改良,
(2) EDR辞書に適合した日本語文法の設計と開発,
(3) LR表高速生成プログラムの開発,
(4) LR表への制約伝播法の組み込み,
(5) ユーザインタフェースの試作.
(2)の,EDR辞書に適合した日本語文法の設計と開発,については,比較的緩 い日本語文法を試作した.この文法は,文節を抽出することを主眼としており, かかり受け関係の解析までは行なわない.現在までに開発した規則数は数百で あり,解析結果の数を減少させることを基準にし,現在この日本語文法規則を 洗練化を進めている.
(3)の,LR表高速生成プログラムの開発,については,LR表の生成過程で作ら れるアイテムのデータ構造に工夫をこらし,重複アイテムの登録を避けるモジュー ルの高速化をはかり,従来のLR表生成プログラムと比較して,十分な高速化を 実現することが可能となっている.ATRで用いているLR表生成プログラムでお よそ3000の対話用文法を用いてLR表を作成する時間と比較して,本研究で作成 したLR表生成ぷるグラムは,実に1000倍近い高速化を実現している.これは, 文法の規模が大きくなるにつれて,高速化の効果が大きいことを意味している.
(4)の,LR表への制約伝播法の組み込み,については,アルゴリズムをインプ リメントして実用に供し得るモジュールを開発した.これらは(3)とともに, (1)と(2)の実験ですでに使われ,その有効性が確認されている.従来の方法と 異なり,本研究で開発した制約伝播アルゴリズムは,LR表生成段階で制約伝播 を行なうものであり,無駄な中間生成物を極力避けるアルゴリズムになってい るので,高速化を果たすとともに使用メモリー量の抑制が可能になる効率の良 いアルゴリズムであることが実験的に確認されている.
(5)の,ユーザインタフェースの試作,については,本システムをツールとし て使用する時に重要となるものであり,解析中途の部分解析木の視覚表示機能, これらのスクロール機能,などについては試作が完了している.