日々の記録

メモ代わりにも使ってます

CUDA C プロフェッショナルプログラミング第2章①

2 メモリの管理

メモリの階層:GPUのメモリ階層において重要なメモリ・・・グローバルメモリとシェアードメモリ
グローバルメモリ \approxCPUのシステムメモリ
シェアードメモリ \approxCPUのキャッシュ

cudaMallocでメモリを確保→cudaMemcpyを使ってホストメモリのデータをGPUのグローバルメモリにコピー.
GPUのグローバルメモリにデータがコピーされたら、ホスト側からカーネル関数を呼び出し、GPUで計算ができる.
カーネルGPUで実行されている間であっても、ホスト側では他の関数を実行できるようになる.
=カーネルはホストに対して非同期.