Mercurial > hg > Papers > 2018 > parusu-master
changeset 35:c38a9829b231
Fix
author | Tatsuki IHA <innparusu@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sat, 03 Feb 2018 22:50:34 +0900 |
parents | 6b1fa842b85c |
children | 1008821ac2c7 |
files | paper/evaluation.tex paper/gpu.tex paper/master_paper.pdf |
diffstat | 3 files changed, 2 insertions(+), 2 deletions(-) [+] |
line wrap: on
line diff
--- a/paper/evaluation.tex Sat Feb 03 22:47:44 2018 +0900 +++ b/paper/evaluation.tex Sat Feb 03 22:50:34 2018 +0900 @@ -131,4 +131,4 @@ 1 CPU と 32 CPU で 約22.12 倍 の速度向上が見られた。 GPU では通信時間を含めると 8 CPU の約1.16倍となり、 kernel のみの実行では 32 CPU の約11.48倍となった。 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられる。 -GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行う実装が必要となる。 +GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行うメタ計算の実装が必要となる。
--- a/paper/gpu.tex Sat Feb 03 22:47:44 2018 +0900 +++ b/paper/gpu.tex Sat Feb 03 22:50:34 2018 +0900 @@ -80,7 +80,7 @@ この際に Host で指定するデータは CUDABuffer に格納されている Data Gear となる。 kernel の実行後、結果を Device から Host にコピーする際は cuMemcpyDtoH 関数で行われる。 -Host のコピーされたデータは Output Data Gear も含んでいるため、 コピー後は Output Data Gear への書き +Host のコピーされたデータは Output Data Gear も含んでいるため、 コピー後は Output Data Gear への書き出す処理に継続する。 kernel の実行はcuLaunchKernel 関数で行われる。 cuLaunchKernel 関数には引数として各次元のblockサイズ、thread サイズ、kernel への引数等を渡す。