学者によって動的に追加更新が起こる特徴記述とは分離して格納し、追加更
新の効率化を図っている。このように、必要に応じてテーブルを分離できる
のは関係モデルと同様である。
タンパク質データベースの統合的な利用環境
公共のタンパク質データベースは保有データの種類により管理主体が異な
り、従って属性名称などさまざまな点で互いに異なる。特徴記述は典型的な
例で、部分的な機能や特徴、構造的な特徴、ある特徴に共通なアミノ酸パ
ターン、とそれぞれ別のデータベースに記述されている。Xウィンドウ上に
構築した統合的なGUIにより、位置情報の図示と併せてこれらの特徴を一元
的に表示することができる。
網羅的な検索(モチーフ検索)の高速化
機能未知のタンパク質のアミノ酸配列と機能既知の配列との相同性から機能
予測を行うことが、タンパク質配列データベースの最も一般的な利用法であ
る。一方モチーフ検索は、アミノ酸の配列バターンからデータベースを検索
する利用法である。いずれも全解探索が必要とされ、並列処理の効果が期待
できる課題と言える。
Kappa-Pには、ユーザから指定されたプログラムをインタフェースプロセス
が各ローカルDBMSへ渡して実行させるという機構がある。各DBMSで検
索された結果は、インタフェースプロセスに集められ、ユーザに返される。
これにより、インタフェースプロセスが各ローカルDBMSからデータを一度
全て受けとり、作業を各PEにデータの一部とともに再配分するような形式
に比べ、通信コストの大きな節約が期待できる。
- 79 -