(37)形態素解析処理プログラム


	マ シ ン:UNIXマシン
	環  境:UNIX
	言  語:CESP
	ソース量:0.3 MB (辞書を除く)
	文  書:マニュアル (日本語)


概要

形態素解析プログラムとその辞書のトータルな開発を支援するツールである。

特徴

・形態素解析プログラム:
−複数の解を一度にグラフ・スタック構造で出力
−未登録語や接続に失敗した部分の検出が容易
− UNIX のサーバ・プログラムとして使用できる
・辞書開発環境:
−解の曖昧性や未登録語の存在、接続に失敗した部分を分かり易く表示
−エントリの登録や削除、カテゴリ属性の修正などが動的に行える

機能

本システムは、自然言語処理システム開発者に共通の形態素プログラム開発環 境を提供し、短時間で容易に、ユーザが必要とする形態素解析プログラムを得 ることを可能としている。

本システムでは、はじめにユーザが必要とする形態素辞書を記述する。そこに は形態素カテゴリ名とその接続に関する属性、各カテゴリに属する形態素の集 まりを定義する。次にこの形態素辞書を中間辞書にトランスレートする。中間 辞書に対しては解析のテストが可能で、不具合があれば形態素カテゴリの属性 の修正やエントリの追加などがダイナミックに行える。得られた形態素プログ ラムは、そのまま CESP 上の他のアプリケーションと組み合わせて使用するこ とができる。

更に本システムでは、CESP 上で得られた形態素解析プログラムをUNIX のサー バとして使うことができる。サーバとして使えば UNIX 上で開発された幅広い アプリケーションと組み合わせて自由に自然言語処理システムを構築すること ができるし、それらが同時に複数の人からアクセスすることも可能となるため、 実用性の高いシステムを構築できる。また、サーバ・プログラムは単に形態素 解析を行うだけではなく、エントリの追加なども可能なため、アプリケーショ ン側でのきめ細かな対応が可能となっている。

FTP


www-admin@icot.or.jp