2 メモリの管理
メモリの階層:GPUのメモリ階層において重要なメモリ・・・グローバルメモリとシェアードメモリ
グローバルメモリCPUのシステムメモリ
シェアードメモリCPUのキャッシュ
cudaMallocでメモリを確保→cudaMemcpyを使ってホストメモリのデータをGPUのグローバルメモリにコピー.
GPUのグローバルメモリにデータがコピーされたら、ホスト側からカーネル関数を呼び出し、GPUで計算ができる.
カーネルがGPUで実行されている間であっても、ホスト側では他の関数を実行できるようになる.
=カーネルはホストに対して非同期.