平成7年度 委託研究ソフトウェアの 成果ソフトウェア

(18) EDR 辞書を用いた日本語解析ツール

研究代表者:田中 穂積 教授
      東京工業大学 大学院 情報理工学研究科


[概要]

EDR 日本語単語辞書を利用し、日本語文の形態素解析・統語解析を統合して行なう システムである。

[特徴]

[機能]

本システムは、 日本電子化辞書研究所(EDR)で 開発された EDR 日本語単語辞書を用 いて、日本語の形態素解析と統語解析を統合して行なうシステムである。EDR 辞書は 登録語数25万語という非常に大規模な辞書であり、日本語単語辞書以外にも概念辞 書・対訳辞書などがあることから、自然言語処理のさまざまな分野での利用が可能で ある。本システムはそのうちの形態素・統語解析部分として提供されるものである。 複数の辞書や意味解析を行なうシステムなどと組み合わせることで、より幅広い目的 に使用することが可能となる。

[実行環境]

本システムの作成は以下の環境で行なった。

    マシン:   SS10/51
    OS:       SunOS 4.1.3
    使用言語: C (gcc 2.7.2 使用)
              protcl ver1.4 (sicstus prolog 2.1#9 + tcl 7.4 + tk 4.0)
              perl 4.036
    ソース量: 約 45k  (辞書引きサーバ) (必須)
              約 71k  (LR 表ジェネレータ)
              約 72k  (MSLR パーザ  ただし、LR 表データは除く) (必須)
なお、本システムは「EDR 辞書を用いた」日本語解析ツールであるため、EDR 日本 語単語辞書が必要であるが、EDR 辞書はフリーの辞書でないため、本システムには含 まれていない。 (EDR 辞書の詳細および入手法に関しては、 ここを参照。) 辞書引きサーバでは EDR が公開している辞書検索ライブラリを使用している。 これは ここより入手可能である。

また、以下の環境でも動作確認を行なった。

    マシン: NEWS5000WI
    OS:     NEWS-OS 4.2.1R
    備考:   tcl/tk によるインタフェースについては未確認

[ファイル名一覧]

  README.euc             このファイル

  dsv/                   辞書引きサーバ
    Makefile
    check_dic.c
    consult.c
    dsv.h
    hash.c
    hash.h
    hinsi_sai2.h
    hira_kana2.c
    make_exe.c
    serv.c

  mlr/                   LR 表ジェネレータ
    LR.c
    LR.h
    Makefile
    README
    ReadRules.c
    WriteLR.c
    WriteLR_cpm.c
    config.h
    connect.c
    cpm.c
    error.c
    fileio.c
    follow.c
    gen_sglr.c
    grform.c
    make_sglr.prl
    mlr2.c
    time.c

  mslr/                  MSLR パーザ
    bigram_sai.pl
    client.pl
    compile.pl
    cond.pl
    consult.pl
    hinshi.pl
    hostdsv.prl
    jiritsugo.pl
    load.pl
    pack.pl
    parser1-2.sglr.pl
    sglr.pl
    stack.pl
    tree.pl
    unpack.pl
    usage
    util.pl
    xmslr.tk

  sample/                サンプル
    dtrans.patch
    sample.bun
    sample.con
    sample.dic
    sample.gr
    search.patch
    sicstusrc.sample

[その他]

(株)日本電子化辞書研究所の ご好意で、sample/sample.bun に含まれる語彙項目につ いてのみ、サンプル辞書という形でアーカイブに含めさせていただいた。

[FTP]



www-admin@icot.or.jp