Mercurial > hg > Papers > 2018 > parusu-master
changeset 52:7d72512ac2e8
Update layout
author | Tatsuki IHA <innparusu@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Tue, 06 Feb 2018 18:09:49 +0900 |
parents | f48e8b45c534 |
children | 4bdffbb885fe |
files | paper/evaluation.tex paper/gpu.tex paper/master_paper.pdf paper/parallelism_gears.tex |
diffstat | 4 files changed, 10 insertions(+), 2 deletions(-) [+] |
line wrap: on
line diff
--- a/paper/evaluation.tex Tue Feb 06 18:03:23 2018 +0900 +++ b/paper/evaluation.tex Tue Feb 06 18:09:49 2018 +0900 @@ -71,12 +71,14 @@ \begin{figure}[htbp] \begin{center} - \includegraphics[scale=0.6]{./fig/twice.pdf} + \includegraphics[scale=0.5]{./fig/twice.pdf} \end{center} \caption{$2^{27}$ のデータに対する Twice} \label{fig:twice} \end{figure} +\newpage + 1 CPU と 32 CPU では 約 27.1 倍の速度向上が見られた。 ある程度の台数効果があると考えられる。 @@ -126,7 +128,7 @@ \begin{figure}[htbp] \begin{center} - \includegraphics[scale=0.6]{./fig/bitonicSort.pdf} + \includegraphics[scale=0.5]{./fig/bitonicSort.pdf} \end{center} \caption{$2^{24}$ のデータに対する BitonicSort} \label{fig:bitonicSort} @@ -137,6 +139,8 @@ 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられる。 GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通信を行うメタ計算の実装が必要となる。 +\newpage + \section{OpenMP との比較} OpenMP\cite{openmp} は C、 C++ のプログラムにアノテーションを付けることで並列化を行う。 アノテーションを \coderef{openMP} のように for 文の前につけることで、ループの並列化を行う。
--- a/paper/gpu.tex Tue Feb 06 18:03:23 2018 +0900 +++ b/paper/gpu.tex Tue Feb 06 18:09:49 2018 +0900 @@ -86,6 +86,8 @@ Gears OS ではデータ並列 Task の際は Iterator Interface を持っており、 そこで指定した長さ、次元数に応じて cuLaunchKernel の引数を決定する。 % 少ないけどコードはなるべく載せたくない(メタ部分 + 複雑) +\newpage %layout + \section{stub Code Gear による kernel の実行} Gears OS では stub Code Gear で CUDA による実行の切り替える。