• トップ
  • G-DEPについて
  • ご購入ガイド
  • サポート
  • お問い合わせ

G-DEPトップ  >  G-DEPの高速演算記  >  高速演算記 第9回 「特別寄稿」東北大学大学院情報科学研究科 滝沢寛之先生

高速演算記 第9回 「特別寄稿」東北大学大学院情報科学研究科 滝沢寛之先生

今回の高速演算記第9回は私共G-DEPが技術指導を頂いております東北大学大学院情報科学研究科の滝沢寛之先生に、先日行われたSC'10について寄稿頂きました。

滝沢寛之先生 プロフィール

1. GPUスパコンの台頭

ACM/IEEE Supercomputing Conference(通称SC)は毎年11月中旬に開催されているHPC分野最大かつ最高峰の国際会議です。
例年1万人程度の参加者数を誇るマンモス会議なので、全米の大きなコンベンションセンターがある都市を渡り歩くようにして開催されています。今年はニューオリンズでの開催で、Ernest N. Morial Convention Centerという巨大なコンベンションセンターが会場でした。

SCと言えば、一流の研究成果の発表の場であると同時に、HPC関連の企業・大学(特にスパコンセンター)が研究活動を広報する場でもあります。今年もたくさんの展示ブースがありました。東北大学サイバーサイエンスセンターも同大学流体科学研究所および金属材料研究所と合同で展示ブースを設け、多くの方々に足を運んでいただきました(図1)。

 

 図1:東北大学のブースで展示されていたペーパークラフト(NEC SX-9)

さて、今年のSC10で印象的だったのは、中国の元気の良さとTOP500リストにおけるGPUスパコン(GPUを演算アクセラレータとして搭載しているスーパーコンピュータを、本稿ではGPUスパコンと呼びます)の大躍進です。
SC10本会議の前日に、中国でのHPCの活動を報告するChina HPC Workshopがありました。私も最初の方だけ参加して話を聞いていましたが、景気のよい話が目白押しという感じでした。中国ではペタスケールのスパコンを3つ建設中だそうで、Tianhe-1A, Nebulaeに引き続いてもう1つのスパコン(SunWay?)も近いうちに登場してくるものと思われます。

その中国の元気の良さとも関係していますが、今年のTOP500リストのトップに立ったのが中国のTianhe-1AというGPUスパコンだったのもとても印象的でした。TOP500リストのトップ5のうち3つまでもがGPUスパコンだったことは、すでにいろいろなところで大々的に報道されているのでご存じの方も多いと思います(図2)。消費電力・設置面積・予算が限られた条件下でTOP500の上位を狙うためには、現時点ではGPUを使うのが最も有効な手段だということが明確になったTOP500だったと言えるでしょう。来年には米国勢の巻き返しも予想されていますので、今後のスパコン開発競争の動向が今から楽しみです。ちなみに日本勢では、東京工業大学のTSUBAME2.0が見事4位に入り、電力効率が高かった(Green500で2位)こともあって、かなりの注目を集めていました。また、民主党の事業仕分けで一般の方にも有名になった京速コンピュータのプロトタイプシステムが170位に入っているのも興味深いです。

このTOP500の結果にも見られるように、ある種のアプリケーションの実行をGPUが飛躍的に高速化できるという点は、多くの方々の見解の一致するところだと思います。そのGPUで高速化可能なアプリケーションのカテゴリがどれくらいの広がりを持っているかという点には議論の余地があるのかもしれませんが、そのカテゴリに入るようにアルゴリズムやデータ構造を工夫する研究も非常に盛んに行われていますので、GPUで高速化されるアプリケーションは今後ますます増えていくことでしょう。

ちなみに、(私の記憶が確かならば)SC04でGPGPUの研究発表を聞いたとき、発表スライドにお風呂に浮かべて遊ぶアヒルの写真が大きく表示されて、「もはやGPGPUはおもちゃではない」という説明がなされていたのを覚えています。これは、逆に言えば「GPGPUなんておもちゃで遊んでいるようなものだ」という意見が当時は主流だったことを端的に示しているわけで、現在の状況からは隔世の感があります。 

 
図2:トップ5のうち3つがGPUスパコン(緑の棒グラフ) (Bill Dally@SC10)  

GPUスパコンと深い関係があるNVIDIA社のBill Dallyの基調講演もありました。現在のGPUスパコンの隆盛について、今回のTOP500やGreen500の結果に基づいて述べた後に、NVIDIAが思い描くエクサスケール時代のスパコンについて発表していました。

2010年現在、GPUの電力あたりの性能は5GFLOPS/W程度です。スパコンの消費電力を20MWと仮定すると、EFLOPS (1000PFLOPS)級のシステムを実現するためには、電力あたりの演算性能を今のGPUの10倍にしなければなりません。GPUの電力あたりの演算性能をアーキテクチャ上の工夫で4倍、半導体加工技術の向上で4倍高めることができると仮定すると、GPUベースのシステムならEFLOPSに到達できます(図3)。

しかし、CPUでは同じ向上率を達成したとしても、電力あたりの演算性能が足りません(さらに6倍の改善が必要)。このため、EFLOPS時代のスパコンの構成要素としてGPUの発展型が有望だという内容でした。そのような未来のGPU(もはやGPUと呼んでよいのか分からない・・・)が搭載している大量の演算器に効率よくデータを供給するために、メモリシステムは深い階層構造になっており、複数のメモリ間のデータ移動を明示的に・・・

続きを読むには...

この記事は会員限定のため、G-DEP会員登録(無料)が必要となります。
未登録の方は「登録」ボタンをクリックしG-DEP会員登録を行ってください。
※会員登録をされますと記事の閲覧の他、コメント投稿も可能になります。

新規登録  ログイン