3. 研究開発の新しい展開と内外の動向
報告者: 宮田一乘委員
3.10.1 はじめに
CG技術のいちばん顕著な応用の場としては、映画での特撮やアニメーション制作が挙げられる。一方で、Webブラウザ上でのコンテンツ、PCや家庭用ビデオゲーム機でのリアルタイムCG映像など、インタラクティブなCG映像も広く市場に浸透している。
本報告では、インターネット上でのグラフィックス技術、リアルタイムCGを支えるハードウェア技術とその具体的な展開例である家庭用ビデオゲーム機の現状、さらに、インタラクティブグラフィックスの応用としてVRやAR、インスタレーションアートなどの事例について述べ、インタラクティブグラフィックスの将来像を考察する。
3.10.2 インターネット上のグラフィックス
インターネットを介して、さまざまな情報がやり取りされるようになった。テキストや画像、映像、音情報の配信と比較して、3次元形状データの配信は、それほど熱心には勧められていないようである。その理由としては、形状データの容量や受け手の再生機能の問題などが挙げられる。本節では、インターネット上での3次元グラフィックスデータの取り扱いに関する、いくつかの試みについて述べる。
3.10.2.1 ポリゴンリダクション
ポリゴンリダクションとは、表示したい物体の画面に表示される大きさや重要度などに応じて、3次元形状データの詳細度を変化させる手法である。この手法は、例えば、インターネット上でのデータ配信時に回線の速度に合わせて適用したり、リアルタイムでの形状データの表示(描画処理速度に合わせる)へ適用したりすることが考えられる。
3.10.2.2 WEB3D
WEB3D[1]は、数年前からCGの新しい応用分野として話題になってきた技術であり、特にインターネットショッピングの利用などに期待されている。インターネットブラウザ上での3次元グラフィックスの表示技術としてVRMLが一時期話題になったが、その後の展開が伸び悩んでいる。WEB3DがVRML以上に注目を浴びている大きな理由としては、以下のような点が挙げられる。
(1) 少ないデータ量
VRMLではポリゴンメッシュで形状を表現するため、対象形状に曲面が含まれる場合にはデータ量が増大する。一方、WEB3Dでは曲面(NURBSパッチ)を直接扱うことができるので、データ量が少なくてすむという利点がある。
(2) 表現の質感向上
従来のように多面体で曲面を近似して表現するよりも、曲面を直接表示したほうが滑らかな物体を表現できる。人体ばかりでなく、車体などのインダストリアルデザインでは自由曲面を多用しているので、WEB3Dでのデータ構造の方が表現の質感向上につながる。また、WED3Dでは、平行光線だけではなく点光源や物体表面への映り込みを表現することができる。例えば車体への風景の映り込みを施すことにより、金属の質感を表現することができ、車体のリアル感が向上する。
以上の2点が技術的な大きな理由であるが、これ以外に、マッキントッシュ版の開発が遅れたこと(半数のデザイナがマッキントッシュを使っている)、VRMLコンソーシアムの体質(非営利団体の舵取りで意見の集約が困難であった)なども、VRMLが予想以上に浸透しなかった理由として挙げられる。
3.10.2.3 情報の埋め込み
素材の収集がネットワークを介して簡単に行えるようになったことで、ネット上で入手した素材を加工し組み合わせて作品を仕上げることも可能になった。しかも、でき上がりの作品から、素材のオリジナリティを判別することは困難である。画像や音楽への電子透かし技術は数年前から研究されてきているが、3次元の形状モデルへの情報埋め込みの技術は始まったばかりである。このような著作権保護のための技術は、動画やモーションデータなどの多様な素材への拡大が予想される。今後は、シングルソース・マルチユースの考えのもとに、コンテンツの再利用に注目が集まると考えられ、このような著作権保護のための技術が重要度を増すと考える。
3.10.3 リアルタイムCGのハードウェア技術
リアルタイムCGを支えるハードウェア技術の大部分は、搭載されているグラフィックボード(ビデオカード)の技術と言える。GUIの発展に伴い、グラフィックを画面に高速に描画する機能を持つグラフィックチップが多数開発されてきた。グラフィックカードはPCの中で果たす役割が年々増大してきており、その心臓部のグラフィックチップは、CPUの進化スピードに匹敵する勢いで進歩している。本節では、3次元グラフィックスの処理の流れと、高速化の手法について述べる。
3.10.3.1 処理の流れ
図 3.10-1 3次元グラフィックスの処理の流れ
図 3.10-1は、一般的な3次元グラフィックスの処理の流れを示している。各段階の処理の内容は次の通りである。
(1) | シーンデータ作成 表示するモデルデータなどの作成やカメラおよびライトの設定。 |
(2) | トラバーサル シーンデータを解釈して必要な描画オブジェクトと描画命令を次段階へ渡す。 |
(3) | ジオメトリ処理 モデルの座標変換、光源計算、投影変換、クリッピング処理などを行う。 |
(4) | ラスタライズ ジオメトリデータのラスタ化やシェーディング処理、Zバッファ処理、テクスチャ処理などを行う。 |
(5) | 表示 ビデオメモリの値を読み出し表示する |
3.10.3.2 高速化の手法
図 3.10-1でのラスタライズと表示の部分は、初期のグラフィックカードからハードウェアで実装されている。現在の3次元グラフィックカードでは、特にジオメトリ処理の部分をハードウェアで実装し、高速描画を実現している。3次元グラフィックスの描画の高速化は、以下のようなさまざまなアプローチがある。
3.10.3.2.1 ジオメトリ処理の高速化
ジオメトリ処理には、CPUで行う方法(ソフトウェアによるアプローチ)と、グラフィックプロセッサで行う方法(ハードウェアによるアプローチ)がある。
ソフトウェアによるアプローチでは、PentiumのSSE命令を使用する方法と、AMDの3DNow!を使用する方法などがある。
一方、ジオメトリエンジンと呼ばれるジオメトリ処理を専用に行うチップがハードウェアとして実装され、最近の3次元グラフィックボードのほとんどに搭載されるまでになっている。CPUの演算速度が十分速ければ、ジオメトリエンジンは不要であるが、現状ではジオメトリエンジンの処理能力がCPUを上回っている。
3.10.3.2.2 グラフィックプロセッサの並列化
グラフィックプロセッサを並列搭載して描画性能を向上させる手法であり、ハイエンドのOpenGL用グラフィックアクセラレータのほとんどが採用している。ラスタライズの分散処理では、ラスタライズプロセッサの数だけ画面を細分割して、各スレッドの処理を割り当てている。
3.10.3.2.3 データ転送の高速化
図 3.10-2 データ転送の高速化
図 3.10-2に示すように、一般的にCPUで処理されたモデルのデータは、PCのメインメモリに保存されてからグラフィックプロセッサに転送される。そこで、メインメモリにデータを転送せずに、CPUから直接グラフィックプロセッサにデータを転送すれば、データ転送の高速化が可能になる。
3.10.3.2.4 nfiniteFXエンジン
nfiniteFXエンジン[2]は、nVIDIA社がグラフィックプロセッサ「GeFORCE3」用に設計したアーキテクチャであり、現在では2世代目のnfiniteFXが発表されている。VertexシェーダとPixelシェーダを構成要素としており、この2つはともにプログラマブルである。Vertexシェーダでは、独自のライティングモデルを定義したり、物体表面への凹凸づけのような手続き型のジオメトリ操作も可能である。Pixelシェーダでは、ピクセル単位でのライティングやテクスチャづけなどを定義できる。Microsoft社のDirectX8[3]にも以上の2つのシェーダ機能が含まれているが、これは、XBOX[4]のグラフィックエンジンを開発したnVIDIA社が、Microsoft社にライセンスしたものである。両者が密接に結びつくことにより、DirectXのAPIを介して、ハードウェア機能を用いた高品質なリアルタイムグラフィックスを実現している。
世代 | CPU | 主メモリ | 画面 | 補助記憶 | 3次元 グラフィックス |
サウンド |
第1世代 (72-93) |
8bit | 2KB | 256 _ 2404 bits/pixel |
ROM | NA | ビープ音 モノラル |
第2世代 (90-96) |
16bit | 128KB | 512 _ 44815 bits/pixel |
ROM | NA | FM音源 ステレオ |
第3世代 (93-99) |
32bit | 2MB | 640 _ 48024 bits/pixel |
ROM CDROM |
ジオメトリ + ラスタエンジン |
FM音源 CD並み |
第4世代 (99- ) |
128bit | 32MB | 640 _ 48024 bits/pixel |
DVDROM CDROM |
ジオメトリ + ラスタエンジン |
CD並み サンプリング |
3.10.4 家庭用ビデオゲームの現状
初めての家庭用ビデオゲーム機「オデッセイ」(Magnavox社)が登場したのが、札幌冬季オリンピックの開催された1972年であった。その後30年の年月を経た家庭用ビデオゲーム機の現状を本節で簡単に述べる。
3.10.4.1 家庭用ビデオゲーム機の世代交代
任天堂の「ファミリーコンピュータ」が登場(1983年)する以前から、いくつかの家庭用ゲーム機が発売されていた。家庭用ゲーム機の世代交代を表 3.10-1にまとめたが、この分類はハードウェアのモデルチェンジにあわせたものである。後述するが、ゲームの外見の質が劇的に変わったのは、3次元グラフィックス機能が搭載され、ゲームの提供に大容量の補助記憶メディアが使われるようになった、第3世代のビデオゲーム機である。
3.10.4.2 PS2・ゲームキューブ・XBOX
現在の家庭用ビデオゲーム機は、PS2(ソニー、1999年)、ゲームキューブ(任天堂、2001年)、XBOX(マイクロソフト、2001年)の3つが主流と考えられている。主要な機能の比較を表
3.10-2に挙げる。
3機種の中では、XBOXがいちばんPCに近いアーキテクチャとなっており、ハードディスクやLANポートまで備えている。PS2では、コアとなるEmotion
Engineにジオメトリエンジンが含まれており、このメディアプロセッサを中心に構成されたアーキテクチャとなっている。一方ゲームキューブでは、CPUとメインメモリ以外の要素は、ほぼFlipperと呼ばれる1チップに集積されている。
XBOXでは、グラフィックスのAPIにDirectXを用いており、PCゲームの開発者が移植しやすいようになっている。一方、PS2では、LINUXによる開発環境をとっており、ミドルウェアの開発が重要な位置を占めている。
描画性能は後発のXBOXが3機種の中でいちばん優れており、毎秒125メガポリゴン、すなわち30フレーム/秒の場合に、1画面約400万ポリゴンで構成されるシーンを表示できる。
3.10.4.3 スプライトからポリゴンへ
第3世代のビデオゲーム機から、3次元グラフィックスの表示機能が搭載されるようになった。これにともない、ゲーム制作のスタイルが一変することになる。第2世代のビデオゲーム機までは、スプライトアニメーションと呼ばれる2次元の画像(通称: ドット絵)を動かすことで、ゲームの画面を構成していた。一方、3次元グラフィックスの表示機能が搭載されることにより、以下のようなメリットが生じる。
PS2 | ゲームキューブ | XBOX | |
CPU | MIPSベースEmotion Engine (295MHz) |
PowerPCベースGekko (485MHz) |
Pentium。 (733MHz) |
主メモリ | 32MB | 43MB | 64MB |
グラフィックス | Graphics Synth(147MHz) | Flipper(162 MHz) | NVIDIA製 (250MHz) |
表示性能 (ポリゴン/秒) |
66メガ | 6-12メガ | 125メガ |
3.10.5 インタラクティブグラフィックスの応用事例
ビデオゲーム以外のインタラクティブグラフィックスの応用事例として、バーチャルリアリティ(VR)や拡張現実感(AR: Augmented Reality)、芸術への応用としてのインスタレーションアートなどが挙げられる。本節では、これらのいくつかの例を挙げる。
3.10.5.1 VR / ARの例
VRやARの例としては、医療への応用が比較的多い。医療現場での経験や訓練を積むためのツールとして研究開発されたものがいくつかあり、例えば、国立がんセンターでの脳腫瘍手術シミュレーションシステム[5]や、米国ノースキャロライナ大学での乳ガン手術のサポートシステム[6]などが挙げられる。後者の例では、頭部につけたトラッキング装置で術者の頭の位置を計測しながら、超音波で撮った病巣の部位をリアルタイムにCGで生成する。術者は、生成されたCG画像をヘッドマウントディスプレイ上で実際に見ている患者の身体と重ね合わせて見ることができ、病巣にうまく治療用の針を刺せるようなサポートが受けられる。
一方、米国MITの石井グループ[7]では、「タンジブル・ビット」というコンセプトで、GUIに替わる新しいユーザインタフェースの研究を行っている。このコンセプトでは、電子的なデジタルの情報に物理的な形を与えることで、インタフェースの実体感が向上し、かつ実世界と仮想世界とがシームレスにつながると考えている。例えば、「I/O
Bulb」では、テーブル上に置かれた建築の模型にある操作を施すと、その建物の影が計算されてテーブル上に表示される。ディスプレイ上の仮想空間内でのモデルに対してではなく、実体として存在する模型に影が投影されることで、より直感的に理解できるインタフェースとなっている。
上述の応用以外に、スーパーマーケットの内装や陳列の検証、オーダーメードのキッチンの使い勝手の検証、オートバイの運転シミュレータによる事故回避の学習など数々の試みがなされている。
3.10.5.2 インスタレーションアートの例
インスタレーションアートとは、1970年の後半ごろから、絵画や彫刻のようなファインアートの範疇で括れない作品に対して多く用いられるようになった用語である。現在では、コンピュータを用いたインタラクティブな作品が多く見受けられるようになり、日本人の作家では岩井俊雄[8]が著名である。彼の作品では、音と映像のインタラクションをテーマにしたものが多く、坂本龍一とのコラボレーションである「Piano」や、「レゾナンス・オブ・フォー〜4つの共鳴」などが代表作品として挙げられる。これらの作品では、演者(もしくは観客)が打鍵したり、テーブル上に設置されたダイアルを回したりすると、コンピュータがそれらのイベントに従ってリアルタイムで映像を生成し、大スクリーンに投影する仕組みになっている。
海外では、SIGGRAPH(www.siggraph.org)やArs Electronica(www.aec.at)、Milia(www.milia.com)などが、インスタレーションアート作品のアカデミックな発表の場として有名である。
3.10.6 おわりに
以上、インタラクティブなCGの構成要素と応用例などを簡単に述べた。日本は、家庭用ビデオゲームの分野において常に世界のトップの座に位置しているが、PCゲームの展開を目論むXBOXの登場により、今後はゲーム市場の混戦が予想される。さらに、インターネットを巻き込んで、家庭用ビデオゲーム機は単なるビデオゲーム機ではなく、家庭におけるメディアセンタとしての地位を確立するようになるかもしれない。一方で、急速に普及したモバイル端末も、CGの新たな応用分野として考えられる。近い将来、すべての情報端末がシームレスに接合し、インタフェースとしてのCGが果たす役割はますます重要になると予想する。
参考文献
[1] | http://www.web3d.org/ |
[2] | http://www.nvidia.com/view.asp?IO=feature_nfinitefx |
[3] | http://www.microsoft.com/japan/directx/default.asp |
[4] | http://xbox.jp/ |
[5] | 青野雅樹ほか: 仮想環境における脳手術シミュレーションシステム, 情報処理学会グラフィクスとCAD研究会, Vol. 95, No. 47, pp. 41-46 (May 1995). |
[6] | Andrei State et al.: Technologies for Augmented Reality Systems: Realizing Ultrasound-guided Needle Biopsies, Proceedings of SIGGRAPH 96, pp. 439-446. |
[7] | http://tangible.media.mit.edu/ |
[8] | http://www.iamas.ac.jp/~iwai/ |