平成7年3月31日 第9号
ICOTはこれまで第五世代コンピュータプロジェクトならびに第五世代コンピュー タの研究基盤化プロジェクトと13年の間、第五世代コンピュータの研究開発を 行ってまいりました。ICOT研究所は本平成7年3月末日をもってその使命を達成 し、一応クローズされることとなりました。 ICOT研究所は一応クローズ致しますが、ICOT無償公開ソフトウェアについて は、4月以降も当分の間は現在の体制のまま、運用し、保守を行うことが決定 されております。 今後の体制その他につきましては、あらためてご連絡致します。
ICOTは、これまで公開してきた84本のソフトウェアに追加し、今回16本のソ フトウェアを新たにICOT無償公開ソフトウェアに指定、公開することになりま した。これでICOT無償公開ソフトウェアは、平成4年8月の第1期リリース以来、 約2年半に100本のソフトウェアを公開したことになります。 今回の公開には、前回公開を行ったKLICの改版であるKLIC第2版を始め、KLIC 上のシステムで、この2年の間、第五世代コンピュータの研究基盤化プロジェ クトにおいて研究開発されたシステムが含まれています。KLICを用いることで、 第五世代コンピュータプロジェクトにおいて開発されてきた技術を、UNIXオペ レーティングシステムの基本部分が動作する計算機上で利用することができる ようになりました。 (1)追加公開ソフトウェアについて 今回IFSに追加されるソフトウェアは、以下のとおりです。 記号処理分野:2本 85 並列論理型言語 KL1 の汎用機上の処理系: KLIC 第2版 86 分散プール 知識処理分野(知識表現、知識ベース、制約):3本 87 並列データベース管理システム: Kappa(KLIC版) 88 並列制約論理型言語: GDCC (KLIC版) 89 異種分散協調問題解決システム: Helios 知識処理分野(問題解決、高次推論、定理証明):3本 90 MGTP/G (KL1版/KLIC版) 91 モデル分散型MGTP/N (KL1版/KLIC版) 92 制約 MGTP (Prolog版/KL1版/KLIC版) 応用実験分野:8本 93 並列反復改善法によるマルチプルアライメント (KLIC版) 94 遺伝的アルゴリズムを用いたアライメントシステム 95 RNAの構造を考慮したアライメントプログラム 96 Quixote を用いた代謝反応知識ベース 97 隠れマルコフモデルの逐次状態分割法による蛋白質配列の分類 98 判別分析に基づいたDNA配列の解析 99 隠れマルコフモデルと遺伝的アルゴリズムによるDNA配列の解析 100 法的推論システム: new HELIC-II (2)追加公開ソフトウェアの概要説明 今回の公開分のソフトウェアの概要と特徴は、以下の通りです。
●85 並列論理型言語 KL1 の汎用機上の処理系: KLIC 第2版
[マシン] UNIXマシンなど [環境] UNIX, MS-DOS [言語] C [概要] KLIC 第2版は並列論理型言語 KL1 の並列処理系であり,KL1言語をC 言語に 翻訳する方式によって高い移植性と高性能を同時に実現している. [特徴] KL1は第五世代コンピュータプロジェクトの核言語として開発された並列論 理型言語である. 本KLIC 第2版システムは, UNIX オペレーティング・システ ムの基本部分が動作する計算機システム上のポータブルで高性能なKL1の並列 処理系である. ・ KL1言語プログラムを最終的には機械語プログラムに翻訳してから実行す る方式をとることによって, インタプリタ方式などよりもはるかに高い性 能を実現している. ・ 機械語への翻訳にはC言語を経由する方式をとり, 低レベルの機械依存の 最適化を機種ごとのCコンパイラに任せることによって, 移植性を損なわ ずに高性能を実現している ・ 他言語プログラムとのリンクも容易である. KLIC第1版と比べての主な改良・拡張点は以下の通りである. ・ ユーザインタフェースの改良. ・ 移植性の高い並列実装 (並列UNIX機や, ネットワーク結合した計算機群が 対象). ・ MS-DOS で動作する版の提供.
●86 分散プール
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1 [概要] データを分散して管理するメモリベースの簡易データベース [特徴] ・ プールに格納されるデータは各ノードにキャッシュされるので、データへ のアクセスは各ノード毎に低コストでなされる。 ・ メモリ消費を多数の処理ノードに分散しているので、プールの最大容量を 大きくすることができる。 ・ データの一貫性を気にすることなくフレキシブルに負荷を分散することが できる。
●87 並列データベース管理システム: Kappa(KLIC版)
[マシン] UNIXマシン [環境] UNIX, KLIC [言語] KL1, C [概要] Kappa は、非正規関係モデルに基づく並列データベース管理システムであり, KLIC上で動作する。 [特徴] ・ 非正規関係モデル 知識情報処理システムや遺伝子情報処理システムの複雑な構造のデータ を管理するために、広く利用されている関係モデルを拡張した非正規関 係モデルを採用している。 ・ データ配置と並列処理 各ノード毎に問合せ処理能力をもっているため、非正規関係の分散配置 や、一つの非正規関係を複数のノードに分ける水平分割によって、ノー ド間の並列処理が可能になる。 ・ UNIXマシン上で動作 KLIC を用いることにより、UNIX オペレーティング・システムの基本部 分が動作する計算機システムで Kappa を利用することができる。
●88 並列制約論理型言語: GDCC (KLIC版)
[マシン] UNIXマシン [環境] UNIX, KLIC [言語] KL1, C [概要] 非線形代数方程式制約等を対象とする並列制約論理型言語処理系のKLIC版で ある。 [特徴] 並列制約論理型言語処理系GDCC (KLIC版)は、GDCCプログラムをKL1に変換す る言語プロセッサと、ユーザの様々な領域の問題に対応するために制約評価系 ライブラリを提供する。本システムはKLIC処理系の上で構築されたため、並列 処理による処理効率の向上と、記述水準と柔軟性を兼ね備えた言語処理系となっ ている。GDCCを用いることによって、ユーザは、問題の解法については原則的 に触れることなしに、プログラミングを行なうことが可能である。
●89 異種分散協調問題解決システム: Helios
[マシン] UNIXマシン [環境] UNIX [言語] C [概要] Heliosは、データベース、制約解消系など様々な問題解決器間のメッセージ 通信を実現することにより、異種分散協調問題解決系の構成を支援するシステ ムである。 [特徴] 異種の問題解決器を各々エージェントとして定義し、エージェントに協調機 能を組み込むことにより、分散環境上に存在する様々な問題解決器が協調して 問題を解く異種分散協調問題解決系を構成することが可能になる。 問題解決器は、各々の異種性を吸収するモジュールである皮でおおうことで エージェントにすることができる。環境はエージェント間のメッセージ通信を 実現する。環境およびその中に含まれるエージェントにより、異種分散協調問 題解決器が構築できる。環境も皮でおおうことでエージェントにすることがで きる。Heliosは、皮と環境を定義する言語CAPL(CAPsule Language)と ENVL(Environment Language)と、エージェントが協調するための機能を提供す る。
●90 MGTP/G (KL1版/KLIC版)
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1, Prolog [概要] ノンホーン節を対象にするグランド版定理証明器MGTP/Gの処理系 [特徴] ・ PIM/UNIXマシン上で動作するボトムアップ型定理証明器 ・ 高速化のための様々な処理方式 (高速節検索,重複計算除去,高速データ 参照)を指定することができる. ・ 各処理方式の比較を公平に行なうための証明図一致機能を持つ. ・ 証明トレース,証明の統計情報の表示を行なうことができる.
●91 モデル分散型MGTP/N (KL1版/KLIC版)
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1 [概要] ホーン節を対象にするノングランド版定理証明器MGTP/Nの処理系 [特徴] モデルコピー型とモデル分散型の二種類ある.両者の違いは,生成するモデ ル要素の保持の仕方にあり,前者は要素のコピーを全てのプロセッサが保持す るのに対し,後者は,モデル要素を各プロセッサに分散して保持する.前者で は証明に必要なデータ (モデル要素) は全て,各プロセッサが局所的に保持し ているので,データ転送のための通信量を低くできるのに対し,後者では,デー タは分散配置されているので,必要に応じてデータを集めなければならず,通 信量は増大する.一方,後者では要素を蓄えるための容量を,プロセッサ数が 増えるに従い大きくすることができる (メモリ・スケーラビリティ) 利点があ る. モデルコピー型は,おおよそ十万個までのアトムを蓄えることができ (PIM/m の場合),推論速度も優れているので,十万個までの証明はモデルコピー 型で,それ以上の証明はモデル分散型で行なうことが望ましい.
●92 制約 MGTP (Prolog版/KL1版/KLIC版)
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1/Prolog [概要] 有限領域の制約充足問題を解くための MGTP 処理系 [特徴] ・ 負の制約伝搬を実現するために、negative atom を用いたルール表現が可 能。 ・ unit refutation ルール、 A, ¬A → false を導入。 ・ P, Q → R といったルールに関して、それと論理的に等価である P, ¬R → ¬Q や ¬R, Q → ¬P といった負の制約伝搬ルールが記 述可能。 ・ モデル候補集合に含まれるアトムとモデル拡張候補集合に含まれる選言の 間で unit simplification が行ない、冗長な枝を削除する。
●93 並列反復改善法によるマルチプルアライメント (KLIC版)
[マシン] UNIXマシン [環境] UNIX, KLIC [言語] KL1, C [概要] タンパク質配列の類似部分を揃えるマルチプルアライメントという解析課題 を解決するものであり、IFS No75のKLIC版である。 [特徴] ダイナミックプログラミングによる部分的な最適化を、反復的に行う反復改 善法を並列化している。具体的には、反復の各段階で、可能な部分的最適化を 複数、それぞれ各要素プロセッサで並列に行い、そのうちで一番評価の良い結 果を採用する、一種の山登り法をとっている。このプログラムは、KLIC処理系 で処理でき、UNIXの基本部分が動作する並列計算機システムで動作させること により、大規模のマルチプルアライメントの問題を高品質に解決できる。解決 結果は生物学的分析を加えるのに足る、信頼性の高いものとなっている。また、 本プログラムの動作の挙動を解析することにより、並列問題解決や並列負荷分 散の観点から、貴重な知見が得られる。
●94 遺伝的アルゴリズムを用いたアライメントシステム
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1 [概要] マルチプルアライメントの問題を組合せ最適化問題と捉え、遺伝的アルゴリ ズムの手法を適用した並列システムである。 [特徴] 本システムは、遺伝的アルゴリズムをマルチ個体群の方式で並列計算機上に 実装したものであり、実用規模のアライメント問題でも、準最適な解を比較的 高速に求めることができる。本システムは、単純なマルチ山登り並列より、早 期に収束に至り、かつ、最良優先探索並列のような局所最適解に陥ることが少 ない。また、ときどき良いスコアの解の部分アライメントを繋ぎ合わせる操作 (クロスオーバー)で、改善の効率を向上させている。
●95 RNAの構造を考慮したアライメントプログラム
[マシン] PIM/UNIXマシン [環境] PIMOS/UNIX, KLIC [言語] KL1 [概要] ステム構造を考慮した複雑な評価値を温度並列シミュレーテッドアニーリン グを用いて最適化し、アライメントの精緻化をする [特徴] RNAのステム構造に現れる相補的突然変異に基づく評価値を最適化しながら、 アライメントの精緻化をするプログラムである。並列反復改善法(IFS No75) などで、暫定的なRNA配列のアライメントをした後に用いる。このプログラム の実行結果は、RNAの立体構造解析や系統解析に有効なデータを提供する。
●96 Quixote を用いた代謝反応知識ベース
[マシン] UNIXマシン [環境] UNIX, Motif, μ-Quixote [言語] C, g++, Quixote [概要] 細胞内の反応関係や活性化関係を視覚化してユーザに提示する知識ベースシ ステム [特徴] ・ Quixote の演繹オブジェクト指向データベース言語の特徴により、生体内 に起こる素過程を、オブジェクト指向の枠組を用いて体系的に知識ベース に表現でき、またその全体像は素過程の追加や詳細化に応じて随時に演繹 機能を使って構成できるようになっている。 ・ 反応関係/活性化関係などの表示を行なうグラフィックユーザインタフェー スを有する。ユーザは、自分の望む詳細度で関係をみることができる。 ・ PIR や ProSite などのデータベースを参照するためのインタフェースを有 する。
●97 隠れマルコフモデルの逐次状態分割法による蛋白質配列の分類
[マシン] UNIXマシン [環境] UNIX, Motif [言語] C [概要] 隠れマルコフモデル (HMM) のネットワークの自動最適化機構とタンパク質 用HMMの成長の監視及び制御 [特徴] ・ 多数のタンパク質のアミノ酸配列を、隠れマルコフモデルの手法によりモ デル化することができる。 ・ 隠れマルコフモデルの文字出力分布や状態間遷移確率といった数値的学習 と同時に、隠れマルコフモデルのネットワークの形状を学習する、逐次状 態分割法という手法を採用している。これは、1個もしくは少数の状態か らなる隠れマルコフネットワークからスタートし、マルコフモデルの数値 的学習に並行して、アミノ酸配列データの統計的傾向から、最も散らばり の大きい出力分布を発生させる箇所を分割し、ネットワーク形状を変化さ せていく手法である。 ・ 形状の学習と数値の学習が、どちらも同じ期待値最大化原理に基づいて進 められる。
●98 判別分析に基づいたDNA配列の解析
[マシン] UNIXマシン [環境] UNIX [言語] C [概要] 判別分析 (数量化理論第II類) を用いてDNA配列群のシグナルパターンを抽 出する。 [特徴] 機能部位のシグナルパターンの抽出は、遺伝子情報処理における重要な問題 の一つである。 シグナルパターンは、DNA-蛋白質間の相互作用に関する考察 や遺伝子同定における機能部位の予測などに用いられる。 本プログラムは、2つのカテゴリー (正例と負例) に分類されたDNA配列群に ついて、判別分析 (数量化理論第II類) を適用したシグナルパターンの抽出を 行なう。
●99 隠れマルコフモデルと遺伝的アルゴリズムによるDNA配列の解析
[マシン] UNIXマシン [環境] UNIX [言語] C [概要] 隠れマルコフモデル (HMM) と遺伝的アルゴリズム (GA) を用いてDNA配列群 のシグナルパターンを抽出する。 [特徴] 機能部位のシグナルパターンの抽出は、遺伝子情報処理における重要な問題 の一つである。 シグナルパターンは、DNA-蛋白質間の相互作用に関する考察 や遺伝子同定における機能部位の予測などに用いられる。 本プログラムは、HMM と GA を用いてDNA配列群のシグナルパターンを抽出 する。シグナルパターンはHMMの形式で表現される。HMMのネットワーク形状は、 GAによってモデルの適合性と複雑性を考慮しながら最適化される。各HMMの評 価値の算出部分は、各々別のプロセスで実現されており、並行処理が可能であ る。
100 法的推論システム: new HELIC-II
[マシン] UNIXマシン [環境] UNIX [言語] C [概要] 多様な法的推論の機能を持ち、法律家の複雑な推論過程をシミュレートする ための実験用ソフトウェアツールである。 [特徴] 以下の法的推論の様々な側面をシミュレートできる実験ツールである。 ・ 事件と特定の価値観を入力すると、その価値観にあった論証を生成する ・ 事件とゴールを入力すると、そのゴールを達成するための論証と、その論 証が最強であるための価値観を生成する ・ 法廷における検察と被告の論争を生成する なお, これら16本のICOT無償公開ソフトウェアの追加に伴い, これまでの 100本のIFS全てを網羅した「ICOT無償公開ソフトウェア総覧」、および第五世 代コンピュータの研究基盤化プロジェクトで公開された23本からなる「ICOT無 償公開ソフトウェア総覧(抽出版)」を発刊しました. これらのカタログご希 望の方は, 下記「ICOT無償公開ソフトウェア担当窓口」まで, メール, あるい はファックス, 郵便にてご連絡ください.
KLICの最初の公開以降,おおくの方々がKLICをお持ちになられましたが, ICOTでは,こうした方々が作られたKL1のプログラムを集め,特にKL1の初学者 のためのプログラムライブラリを作っております。 KL1のプログラムは,ICOT無償公開ソフトウェアにも数多く入っていますが, これらはいずれも相当大きなプログラムで,KL1を初めて使おうとされる方が 読んだり,試しに改造したりしていただくのには不適当なものです.そこで, 皆様が作られたKL1プログラムを,これからKL1の勉強をする方のためにご提供 いただきたいと思います.公開に際しては,「ICOT無償公開ソフトウェア」と 同等の条件で行うことが望ましいと思います.ご賛同いただける方は,「ICOT 無償公開ソフトウェア係」まで電子メールでお送り下さい. ICOTではお送りいただいたプログラムをまとめ,初学者のためのKL1プログ ラムライブラリを作成し,ICOT無償公開ソフトウェアと同様に公開いたします.
ICOT 無償公開ソフトウェアとして公開されているソフトウェアに関し, ユー ザグループを結成し, そのソフトウェアに関する研究, 改良, 改版等を行いた いとお考えの方がおられましたら, 本ニュースレター末尾の無償公開ソフトウェ ア担当まで, メールでお知らせ下さい. お申し出の内容を, メール, ニュースレター等で告知の上, それに対する反 応を連絡します. また, 改版を行った結果, 他のユーザにも有用であると判断され, さらにご 希望があれば無償公開ソフトウェアのFTPサーバーに登録します.
制約論理型言語cu-Prologは,UNIX上で動くIFSオリジナル版と,中京大学の 白井英俊先生により移植された Macintosh版および MS-DOS版とがあります. cu-Prologは自然言語処理ツールとしてだけでなく,C言語によるソースつきの コンパクトなProlog処理系としても国内外で利用されているようです.利用者 も,大学院生から,自然言語処理や制約論理型言語の研究者と多岐にわたって います. cu-Prolog各版のバージョンアップ等の情報を提供し,さらに制約ベース文 法,制約論理型言語の自然言語処理への応用といった分野の情報交換を行なう ため,cu-Prologユーザーズグループ(メイリングリスト)が運営されています. アドレスは cup@icot.or.jp です.メイリングリストに登録ご希望の方は cup-request@icot.or.jp までメイルをお願いします.現在の登録者は49人です.
本ソフトウェアに関するお問い合わせ, ご連絡などは原則としてe-mailでお 願いします. また本ニュースレターはe-mailで配布しておりますので, 新規購 読ご希望の方, バックナンバーをご希望の方は, e-mailアドレスを次の宛先ま でご連絡ください. ifs@icot.or.jp なお, e-mailがご利用になれない場合, お問い合わせの節は以下の宛先まで 郵便またはファックスでご連絡ください. 〒108 東京都港区三田 1丁目4番28号 三田国際ビル 21階 (財) 新世代コンピュータ技術開発機構 無償公開ソフトウェア担当 FAX : 03-3456-1618 皆様のお近くに, ICOT無償公開ソフトウェアに興味をお持ちの方がいらっしゃ いましたら, 上記窓口までご連絡ください. 同一覧を郵送し, 今後, 本ニュー スレターを継続してお送りします.