平成7年度 委託研究ソフトウェアの提案

(17) 単一化に基づく日英文法の開発および言語知識評価支援システム

研究代表者:松本 裕治 教授
      奈良先端科学技術大学院大学 情報科学研究科




[目次]

  1. 研究の背景
  2. 研究の目的
  3. 研究の内容
  4. ソフトウェア成果


[研究の背景]

自然言語処理の分野では言語処理のための様々な解析方法や文法,語彙に関す る記述の方法が提案されており,理論的な整備も進んでいる.それぞれの研究 者および研究機関が様々な文法体系に従って文法の開発を行なっているが,研 究者が共有して蓄積的に利用し発展させることができるような具体的な文法は 多くは存在しない.また,開発された文法を動作させるための解析エンジンを 共有することも現状ではあまり進んでいない.

一方,近年大量の電子化された言語データの入手が可能になったことを反映し て,文法や語彙に関する知識を言語データから自動もしくは半自動的に抽出す る研究が行なわれている.しかし,抽出された知識を評価するための客観的な 基準を設けることは難しい.特に抽出された知識を既存の他の知識と統合して, 総合的な枠組の中で評価するための基盤作りはまったく進んでいないと言って よい.技術の進展のためにはこのような評価のための基盤作りが重要である.


[研究の目的]

本研究の目的は,上で述べた問題を解決することにある.そのために,理論的 な文法体系として最も洗練されているHPSG(Head-driven Phrase Structure Grammar)をベースにし,適用範囲の広さと拡張性を考慮した日本語および英語 の基本文法の開発を行なう.HPSGなどの単一化文法の特徴は文法の記述とそれ に基づく文解析処理の手続きが完全に分離されていることである.文法規則を 宣言的に記述することができるので,それぞれの規則の意味が明確である.ま た多くの文法的な規則が個々の文法規則ではなく,文法規則全体に対してなり たつ原則として記述されることや,個々の語に関連する規則性は語彙のレベル に記述されることから,具体的な処理手法には関心のない言語学者にとっても 理解しやすい.本研究の目的の一つは,ある程度の広い適用範囲をもつ文法を このような宣言的な体系の上で記述し,様々な研究者が文法を開発するための 蓄積性の高い共有化文法を構築することである.

また,上記のような文法体系の性能に影響を与えるのは主に語に記述された文 法的な知識および解釈に影響する構文的意味的な優先性に関する知識である. このような知識は言語の語彙の量が膨大であること,また,分野によって語の 使われ方や意味が異なることから,短期間に完全なものを構築することは不可 能である.今後は,言語の具体的な用例などをもとにこのような言語知識を抽 出する研究が重要であり,こうして得られた知識の精度を客観的に評価する枠 組やシステムの存在が重要である.自動抽出された言語知識の評価に関する研 究はまだ始まったばかりで,総合的な評価を行なうことのできるシステムや方 法論は存在しない.本研究では,このような評価のための基盤作りをもう一つ の目的とする.


[研究の内容]

本研究で開発するソフトウェアシステムは,次の2種類である.研究は平成7 年度および8年度の2年間実施する予定である.

1)単一化文法に基づく拡張性の高い日英基本文法
2)文法・語彙知識の評価のための言語解析システム

平成7年度は1)の文法をHPSG(Head-driven Phrase Structure Grammar)をベー スにして開発し,さらに他の様々な文法体系や語の構文意味記述の体系をHPSG 記述に変換するためのツール群の試作を行なう.HPSGをベースとする文法は特 に英語についてはすでにいくつかの機関で開発が行なわれているが,教科書的 な文を対象にしたものしか存在せず,現実的な文を対象にしたものは開発され ていない.本研究では英語および日本語に対して,実用性を目指したHPSG文法 の開発を行なう.HPSGを代表とする単一化文法の特徴は,文法規則が個別の構 文構造を説明するのではなく,文法規則全般に成立するような原理を中心とし て文法を記述し,個別の語に依存する言語現象は語のレベルに記述することで ある.語彙的な知識をHPSGの素性構造によって表現する方法を提案することに より,用言の格フレーム構造やシソーラスのような様々な語彙的知識をHPSG文 法の上にマップすることが可能であると考えている.平成7年度はある程度の 適用範囲をもつ英語および日本語のHPSG文法を記述することを目的とし,いく つかの語彙知識記述の体系をHPSGの語彙記述に変換するツール群の開発を行な う.また,開発された文法を実際に実行する環境を構築する必要がある.その ため,その動作状況を観察することによって文法や語彙知識の修正や拡張を可 能にするための言語解析システム(上記の2)のプロトタイプの開発も平成7年 度に実施する.

平成8年度は,日英文法の修正と拡張を引続き行なうとともに,文法・語彙知 識の評価のための言語解析システムの開発を行なう.言語解析システムの性能 は,HPSGのような宣言的な方法で記述される知識以外に,実際の言語運用の場 面で重要になる様々な優先性の規則によって左右される.宣言的な記述が可能 な解釈を網羅的に生成する能力をもつのとは対象的に,優先性の規則は,語と 語の自然な意味的なつながりや文脈上の解釈によって解釈間の優先性を決定し てくれる.言語処理システムの開発にはこのような知識を統合的に利用するこ とが重要である.一方,言語処理のために利用される個々の知識は,統合的な 観点から構築されることは少ない.特に,近年大規模な言語データが利用可能 になってきたことを反映して,大規模テキストデータからの言語知識の抽出の 研究が盛んに行なわれているが,動詞の格フレーム,名詞の意味的な類似性, ある種の構文現象の曖昧性解消のための知識のように特定の言語知識のみを抽 出する研究が多い.このような知識をより広い統合的な利用を考慮して評価す ることはほとんど行なわれていない.本研究では,言語処理のための語彙に関 する宣言的知識および優先性に関する知識を統合的な視点で評価できる枠組を 構築を行なう.これにより,言語知識の評価を客観的に行なうことのできる基 盤を提供するだけでなく,言語解析のおける個々の言語知識の影響や重要性を 評価することが可能になる.


[ソフトウェア成果]

(1)作成されるソフトウェア名称

NAIST-HPSG : HPSG(Head-driven Phrase Structure Grammar)の英語版

NAIST-JPSG : HPSG(Head-driven Phrase Structure Grammar)の日本語版

SAX+ : 構文解析および語彙知識,文法規則の評価システム

(2)そのソフトウェアの機能/役割/特徴

NAIST-HPSGおよびNAIST-JPSGは,自然言語のための単一化文法として代表的で あり,かつ理論的に最も整備の進んだHPSG(Head-driven Phrase Structure Grammar)を実用的な文法として整理したものである.ただし,これを特定の文 法体系であるHPSGだけに留まらず,HPSGの記述能力を活かすことによって,現 存の様々な文法体系および語彙記述(格フレームなど)からの変換のためのツー ル群を用意する.これにより,次のような2つの機能の実現を容易にすると考 えられる.すなわち,様々な語彙および文法知識を融合して実行するシステム の実現を促進すること,および,統合的な解析システムの下で個々の(語彙的, 文法的)知識の評価を行なうこと,である.

SAX+システムは,従来我々が開発してきた汎用の構文解析システムをさらに拡 張したものである.上記のNAIST-HPSGおよびNAIST-JPSGを基本的な文法記述言 語とし,様々な優先度規則の記述を許すことによって,曖昧性の解消された最 も優位な解釈結果を出力する.文法および語彙に表現された優先順位付けのパ ラメータの重みなどを自由に設定することにより,それぞれの知識が解析結果 に及ぼす影響を客観的に観測可能な環境を提供し,語彙および文法開発者のた めの支援環境と開発された語彙知識,文法知識の評価環境を実現する.




www-admin@icot.or.jp