• トップ
  • G-DEPについて
  • ご購入ガイド
  • サポート
  • お問い合わせ

G-DEPトップ  >  第3回 CUDA4.0のインストール

第3回 CUDA4.0のインストール

第3回 「CUDA4.0のインストール」 

<< 第2回   |   目次に戻る   |   第4回 >>

 今回はCUDA4.0のインストールについてお話しします。
 CUDAプログラミングを行う前に、メモリ構造の話やC言語等について触れておく必要があるかと思いますが、とりあえず動かしてみよう!ということで、それはまた次回お話しします。
 
 
3.1 CUDAに必要なもの

まずはCUDAをインストールする前に、対応環境について確認していきます。

【GPU】
 CUDAに対応したNVIDIA製GPUが必要です。現在NVIDIA社から発売されているGPU製品であればほとんどがCUDAに対応していますが、自分のGPUがCUDAに対応しているか確認したい方はこちらのページ(NVIDIAwebsite)にCUDA対応のGPUが記載されています。
 
【OS】
・Windows XP / Vista / 7(32bit版、64bit版両対応)
・Linux(Fedora 7以降、Red Hat Enterprise Linux 3以降など)
・Mac OS X 10.5.2以降
 
【コンパイラ】
 各OSに対応したCコンパイラ(WindowsならVisual Studio、Linuxならgccなど)
 
 
 
3.2 CUDAのインストール

 CUDAに必要なツールは、NVIDIA公式ウェブサイトのCUDA TOOLKITにあります。
 ここから、自分のOSバージョンにあった項目へ進んで以下の3つのツールをダウンロードし、それぞれ上から順番にインストールします。
  • Developer Drivers
  • CUDA Toolkit
  • GPU Computing SDK

 各OS毎の詳しいCUDAのインストール方法例は以下のリンク先で説明します。Windows版のみCUDAツールのダウンロードから説明します。

Windows 7での環境の整え方(※10/17追記)

Mac OS Xでの環境の整え方

Linux(CentOS 5.6)での環境の整え方

 
 
3.3 deviceQuery(ディバイスクエリ)

 CUDA Toolkitをインストールする際に付いてくるdeviceQuery.exeを起動すると、GPUに関する情報を取得することができます。
 
 Widowsの場合、CUDA GPU Computing SDK 4.0 Browserを立ち上げ、「device Query」で検索すると出てきます。
また直接起動したい場合、実行ファイルの場所はディフォルトであれば
C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\bin\win64\Release\deviceQuery.exe
になります。
 
 試しに、自分がプライベートで使っているPCで起動させてみます。(Windows 7 64bit / GTX 470 / CUDA4.0)
 

 

Device QueryをRun
(画像をクリックすると全ての情報が見られます)
 
上のイメージで緑の枠内と赤線で引いた部分は、特におさえておくべき項目です。
 
Device 0…
認識されているグラフィックカード。数字は識別番号で、PC内に複数枚あれば0,1,2…として付け加えられます。その右の” ”の部分は認識されているグラフィックカードの型番。
 
CUDA Capability Major/Minor version number
認識されているグラフィックカードに搭載されているGPUの「コンピュートケイパビリティ」。ここでは「2.0」と表示されていますが、この数字によってハードウェアレベルでのCUDAのサポートが変わってきます。CUDA自体のバージョンではないので注意!(CUDAのバージョンはその上の項目です。)
このバージョンはGPUのアーキテクチャ世代毎に異なっており、1.0に始まりバージョン毎に様々な機能が追加されました。特に、1.3で倍精度演算機能が追加されたことは数値計算において大きな発展といえるでしょう。アーキテクチャの詳細については後のコラムで説明する予定です。
 
Total amount of global memory
認識されているグラフィックカードに搭載されているVRAMの容量。またの名をグローバルメモリと呼びます。
 
(14) Multiprocessors × (32) CUDA Cores/MP
搭載されている全GPUコア数。Multiprocessorsの前の数字がマルチプロセッサーの数で、CUDA Cores/MPが1マルチプロセッサー当たりのコア数なので、2つをかけると全体のコア数になります。ここでは14×32=448個。
 
GPU Clock Speed
文字通りGPUの動作クロック数を示しています。基本的にはこの数字が大きいほどSP当たりの処理が速いということになります。
 
 
 このdeviceQueryは使用中のGPUの様々な情報が分かり、これらの情報を基にカーネルプログラムの設定を行ったり、CUDAのサンプルプログラムがうまく動作しない時などにGPUのハードウェアがきちんと認識されているかどうかを確認する目的として「deviceQuery」を使用することも多いため、起動の仕方を覚えておくと便利です。

 

 各OSでのインストールを紹介しましたが、インストールできましたでしょうか?サンプルプログラムにはGPUでのリアルタイムな計算をCG描写するものが多くありますが、自分のPCで動かしてみると物理計算の面白みが分かるのではないでしょうか。

 次回は、実際にプログラムを書いてみる前に、グラフィックボードおよびGPUチップの構造、メモリの仕組み、C言語からの拡張などについて勉強していきます。

 

<< 第2回   |   目次に戻る   |   第4回 >>


【参考ページ】(新しいウィンドウで開きます)

CUDA ZONE(NVIDIA公式ウェブサイト)…NVIDIAホームページのにアクセスすると、CUDAに関するあらゆる情報がのっていますので、ぜひ目を通してみてください。ただ、現在は英語のページしか存在しません。

(執筆 G-DEP Associate Research Engineer 東京大学大学院工学系研究科 岡安優)