GPUはレジスタモンスターだ。近年のGPUは、膨大な数のレジスタを内部に備える。例えば、NVIDIAのGeForce GTX 280(GT200)は、GPU全体で491,520本の32-bitレジスタを持つ。チップ全体で見るとレジスタの量(データ領域)は1,920KB。PC向けCPUのL2キャッシュ並の量だ。CPUが ...
GPUは超多数のスレッドを並列に実行する。NVIDIAはホストCPUとインタフェースし、多数のスレッドを実行させる機構を「ギガスレッドエンジン」と呼んでいる。 3次元のスレッド配列であるブロックを定義し、ホストCPUからGPUに対しては、そのブロックの3次元 ...
Kepler GPUでは、ギガスレッドエンジンからSMに割り付けられたスレッドブロックのワープ群を4つのワープスケジューラに割り振る。各ワープスケジューラは最大16個のワープを分担し、これらのワープを並列に処理することができるようになっている。