並列推論マシン「PIM」 PIMとは? ・汎用マシン PIMは汎用の高級言語KL1を効率良く実行するMIMDマシンである。 ・1000台規模の並列マシン 高性能なプロセッサを拡張性のあるアーキテクチャで結合 1000台規模のプロセッサでも十分な台数効果が得られる. ・推論マシン 並行論理型言語KL1を効率良く実行するための専用命令やハードウェア(デレ ファレンス命令,タグアーキテクチャetc.) ・処理能力 PIM/p,PIM/mの要素プロセッサ1台は300〜600KRPS(append) PIM/p最大構成(512台)で約250MRPS(append) 250MRPSは約3.6GIPSに相当 ●5つのモジュール 様々なアーキテクチャの性能を比較するために5つのモジュールを開発:PIM/p, PIM/mラPIM/c,PIM/i,PIM/k KL1処理系 概要 KL1処理系は、異なるハードウェアを持つ各PIMモジュール上に,共通仕様の KL1インタフエースを効率良く実現するためのソフトウェアである. 機能と特徴 ・Pro1ogのWAMと同様に中間言語にコンパイルする方式を採用した.この方式 は開発が容易で移植性が高い. ・中問言語の抽象機械はPIMの実ハードウェアに応じて機械語命令やマイクロプ ログラムに変換される. ・抽象機械はC言語にも変換できるので,汎用計算機上で容易にシミュレーション、 デバッグが可能となる. KL1プログラム実行の枠組 ・KL1は中問言語KL1-Bにコンパイルされる. ・KL1-Bコ一ドは抽象機械の上で実行される. ・抽象機械は仮想ハードウェア上のランタイムシステムとして記述される. ・仮想ハードウエアには,共有メモリ・マルチプロセッサが疎結合されたようなアー キテクチャを想定している. PIM/p ●Two-1eve1 hierarchical structure_a six-dimensional hypercube network connects c1usters,each of which contains eight processors sharing a memory unit. ●KL1-oriented snoop caches which realize 1ow latency communication and synchronization ●Enhanced instruction set by macro calls ・2階層の構成一6次元ハイパーキューブネットワークがクラスタを接続し各ク ラスタには1台のメモリを共有する8台のプロセッサがある. ・KL1向きスヌープキャッシュによる高速な通信と同期 ・マクロ呼び出しによる命令の高機能化 PIM/m ●Inherits Multi-PSI's architecture and firmware ●A single 1ayer network and a node consisting of a CPU make for simple architecture and high sca1ability. ●Capab1e of examining various parallel processing techniques,such as task division and mapping ・Mu1ti-PSIアーキテクチャ及びファームウェアの継承 ・1階層ネットワーク,1ノード1CPUのシンプルなアーキテクチャで高い拡張性 ・問題分割、マッビングなどの並列処理技術の研究開発に向いている. PIM/c ●Contains eight processing e1ements which employ horizontal microprogramming contro1 and are tightly coupled ●Dedicated hardware transmits global scope variable (e.g.,1oad information) between clusters with low latency. ●A c1uster has high-speed KL1-oriented snoop caches and registers with broadcast facility ・水平型マイクロプログラム方式の要素プロセッサ8台を密結合 ・負荷情報などの大域変数をクラスタ間に渡って低遅延で転送する専用ハードウェア ・クラスタ内にはKL1向きの高速なスヌープキャッシュと放送機能付きレジスタ