kernel_nam<<<grid, block>>>(argument_list);
CUDAプログラミングモデルには、スレッド階層という概念がある.
実行設定では、GPUで実行されるスレッドのスケジュール方法を指定できる.
実行設定の一つはグリッドサイズであり、作成するブロックの数を表している.
二つ目の値はブロックサイズであり、各ブロック内のスレッドの数を表している.
グリッドサイズとブロックサイズを指定することにより、以下の設定が定義される.
・カーネルのスレッドの合計数
・カーネルで使用したいスレッドのレイアウト