changeset 35:c38a9829b231

Fix
author Tatsuki IHA <innparusu@cr.ie.u-ryukyu.ac.jp>
date Sat, 03 Feb 2018 22:50:34 +0900
parents 6b1fa842b85c
children 1008821ac2c7
files paper/evaluation.tex paper/gpu.tex paper/master_paper.pdf
diffstat 3 files changed, 2 insertions(+), 2 deletions(-) [+]
line wrap: on
line diff
--- a/paper/evaluation.tex	Sat Feb 03 22:47:44 2018 +0900
+++ b/paper/evaluation.tex	Sat Feb 03 22:50:34 2018 +0900
@@ -131,4 +131,4 @@
 1 CPU と 32 CPU で 約22.12 倍 の速度向上が見られた。
 GPU では通信時間を含めると 8 CPU の約1.16倍となり、 kernel のみの実行では 32 CPU の約11.48倍となった。
 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられる。
-GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行う実装が必要となる。
+GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行うメタ計算の実装が必要となる。
--- a/paper/gpu.tex	Sat Feb 03 22:47:44 2018 +0900
+++ b/paper/gpu.tex	Sat Feb 03 22:50:34 2018 +0900
@@ -80,7 +80,7 @@
 この際に Host で指定するデータは CUDABuffer に格納されている Data Gear となる。
 
 kernel の実行後、結果を Device から Host にコピーする際は cuMemcpyDtoH 関数で行われる。
-Host のコピーされたデータは Output Data Gear も含んでいるため、 コピー後は Output Data Gear への書き
+Host のコピーされたデータは Output Data Gear も含んでいるため、 コピー後は Output Data Gear への書き出す処理に継続する。
 
 kernel の実行はcuLaunchKernel 関数で行われる。
 cuLaunchKernel 関数には引数として各次元のblockサイズ、thread サイズ、kernel への引数等を渡す。
Binary file paper/master_paper.pdf has changed