Mercurial > hg > Papers > 2018 > parusu-master
diff paper/gpu.tex @ 32:ebcf093795f3
Add twice examples
author | Tatsuki IHA <innparusu@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sat, 03 Feb 2018 20:56:35 +0900 |
parents | 8793903e4a0d |
children | c38a9829b231 |
line wrap: on
line diff
--- a/paper/gpu.tex Fri Feb 02 04:14:20 2018 +0900 +++ b/paper/gpu.tex Sat Feb 03 20:56:35 2018 +0900 @@ -37,6 +37,8 @@ また、block 内の thread 数は blockDim という組み込み変数で取得でき、これも3次元のベクター型になっている。 CUDA では これらの組み込み変数から thread が対応するデータを割り出し、データ並列の処理を行う。 +\newpage + \section{CUDAWorker} CUDAWorker は TaskManager から送信される CUDA用の Task を取得し、実行を行う。 @@ -85,6 +87,8 @@ 実際にcuLaunchKernel 関数を使用している部分を \coderef{cuLaunchKernel} に示す。 +\newpage + \lstinputlisting[caption=kernel に起動, label=code:cuLaunchKernel]{./src/cuLaunchKernel.cbc} Gears OS ではデータ並列 Task の際は Iterator Interface を持っており、 そこで指定した長さ、次元数に応じて cuLaunchKernel の引数を決定する(\coderef{cuLaunchKernel} 11-18行目)。