Mercurial > hg > Papers > 2018 > parusu-master

--- a/paper/evaluation.tex	Tue Feb 06 18:03:23 2018 +0900
+++ b/paper/evaluation.tex	Tue Feb 06 18:09:49 2018 +0900
@@ -71,12 +71,14 @@

 \begin{figure}[htbp]
     \begin{center}
-        \includegraphics[scale=0.6]{./fig/twice.pdf}
+        \includegraphics[scale=0.5]{./fig/twice.pdf}
     \end{center}
     \caption{$2^{27}$ のデータに対する Twice}
     \label{fig:twice}
 \end{figure}

+\newpage
+
 1 CPU と 32 CPU では 約 27.1 倍の速度向上が見られた。
 ある程度の台数効果があると考えられる。

@@ -126,7 +128,7 @@

 \begin{figure}[htbp]
     \begin{center}
-        \includegraphics[scale=0.6]{./fig/bitonicSort.pdf}
+        \includegraphics[scale=0.5]{./fig/bitonicSort.pdf}
     \end{center}
     \caption{$2^{24}$ のデータに対する BitonicSort}
     \label{fig:bitonicSort}
@@ -137,6 +139,8 @@
 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられる。
 GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行うメタ計算の実装が必要となる。

+\newpage
+
 \section{OpenMP との比較}
 OpenMP\cite{openmp} は C、 C++ のプログラムにアノテーションを付けることで並列化を行う。
 アノテーションを \coderef{openMP} のように for 文の前につけることで、ループの並列化を行う。
--- a/paper/gpu.tex	Tue Feb 06 18:03:23 2018 +0900
+++ b/paper/gpu.tex	Tue Feb 06 18:09:49 2018 +0900
@@ -86,6 +86,8 @@
 Gears OS ではデータ並列 Task の際は Iterator Interface を持っており、 そこで指定した長さ、次元数に応じて cuLaunchKernel の引数を決定する。

 % 少ないけどコードはなるべく載せたくない(メタ部分 + 複雑)
+\newpage %layout
+
 \section{stub Code Gear による kernel の実行}
 Gears OS では stub Code Gear で CUDA による実行の切り替える。
Binary file paper/master_paper.pdf has changed
--- a/paper/parallelism_gears.tex	Tue Feb 06 18:03:23 2018 +0900
+++ b/paper/parallelism_gears.tex	Tue Feb 06 18:09:49 2018 +0900
@@ -162,6 +162,8 @@
     \label{fig:putSynchronizedQueue2}
 \end{figure}

+\newpage
+
 \figref{putSynchronizedQueue2}は2つのスレッドが以下の順番で処理を行っている。

 \begin{enumerate}