分散データベースとして

システム構成
DBMSは大量のデータを扱うので、疎結合並列処理における通信量が大きな意味を持ってくる。そのため、密接に関連するデータを同じクラスタに置くなどのデータの配置が重要で、さらに、問い合わせ処理において通信量が少なくなるようなプランを立てる必要もある。これらを行なうためには、分散データベースの構成が向いている。
各クラスタにローカルDBMS(LDBMS)と呼ばれるDBMSを配置し、全体で一つのデータベースを管理する。このLDBMSは、それ自身でDBMSとしての全機能を持ち、複数LDBMSが関与する問い合わせを処理するために、二相コミットプロトコルに基づく分散トランザクションの機能を持っている。
また、複数のLDBMSにより一つのデータベースを管理するためテーブル名などの大域情報の管理が問題となるが、それを管理するサーバDBMS(SDBMS)の複製を作ることにより、アクセスの集中を回避する。
クラスタに割り当てられたLDBMSは、その内部処理で密結合向きの並列処理を行なう。
データ配置と並列処理
効率的な並列処理を行なうためには、各クラスタの負荷とクラスタ間の通信量をバランスさせてやる必要がある。DBMSの場合はデータが二次記憶上に保存され、しかも大量であることから、データの配置と並列処理方式が密接に関係してくる。
- 分散配置
  分散配置は、複数PEの計算能力を利用する最も簡単な場合である。この場合、問い合わせ処理時の通信量と負荷を考慮し、テーブルを配置する必要がある。
- 水平分割
  水平分割は、論理的には一つのテーブルをレコード単位に複数のテーブルに分割し、それらを異なるLDBMSに配置することで並列性を引き出す手法である。分割された個々のテーブルには基本的に同じ演算が出され、最後に個々の演算結果をまとめる。
  一つのテーブルが一つのクラスタでは扱い切れない程の量の場合や、特にデータ検索などのCPU負荷が大きい演算を重視する場合などに有効である。
- 複製
  関係の複製によって、可用性を高めたり、アクセスの集中を回避することができる。

[Kappaホームページ] [Kappaプログラミング] [IFS Kappa] [参考文献]