annotate prepaper/finalpre.tex @ 14:4d204f37fc8a draft default tip

fix
author ikkun
date Thu, 16 Feb 2017 12:40:29 +0900
parents f1307a309875
children
Ignore whitespace changes - Everywhere: Within whitespace: At end of lines:
rev   line source
9
ikkun
parents:
diff changeset
1 \documentclass[twocolumn,twoside,9.5pt]{jarticle}
ikkun
parents:
diff changeset
2 \usepackage[dvipdfmx]{graphicx}
ikkun
parents:
diff changeset
3 \usepackage{picins}
ikkun
parents:
diff changeset
4 \usepackage{fancyhdr}
ikkun
parents:
diff changeset
5 %\pagestyle{fancy}
ikkun
parents:
diff changeset
6 \lhead{\parpic{\includegraphics[height=1zw,keepaspectratio,bb=0 0 251 246]{pic/emblem-bitmap.pdf}}琉球大学主催 工学部情報工学科 卒業研究発表会}
ikkun
parents:
diff changeset
7 \rhead{}
ikkun
parents:
diff changeset
8 \cfoot{}
ikkun
parents:
diff changeset
9
ikkun
parents:
diff changeset
10 \setlength{\topmargin}{-1in \addtolength{\topmargin}{15mm}}
ikkun
parents:
diff changeset
11 \setlength{\headheight}{0mm}
ikkun
parents:
diff changeset
12 \setlength{\headsep}{5mm}
ikkun
parents:
diff changeset
13 \setlength{\oddsidemargin}{-1in \addtolength{\oddsidemargin}{11mm}}
ikkun
parents:
diff changeset
14 \setlength{\evensidemargin}{-1in \addtolength{\evensidemargin}{21mm}}
ikkun
parents:
diff changeset
15 \setlength{\textwidth}{181mm}
ikkun
parents:
diff changeset
16 \setlength{\textheight}{261mm}
ikkun
parents:
diff changeset
17 \setlength{\footskip}{0mm}
ikkun
parents:
diff changeset
18 \pagestyle{empty}
ikkun
parents:
diff changeset
19
ikkun
parents:
diff changeset
20 \input{dummy.tex}
ikkun
parents:
diff changeset
21 \begin{document}
ikkun
parents:
diff changeset
22 \title{Code Gear Data Gear によるGPGPU処理実装}
ikkun
parents:
diff changeset
23 \author{135704C 氏名 {東恩納}{琢偉} 指導教員 : 河野 真治}
ikkun
parents:
diff changeset
24 \date{}
ikkun
parents:
diff changeset
25 \twocolumn [
ikkun
parents:
diff changeset
26 \maketitle
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
27 \begin{abst}
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
28 Gears OS is a highly reliable operating system based on continuation
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
29 and meta computation. It support interface which is a set of data Gear
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
30 and code Gear. In this research CUDA computation is implemented.
10
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
31 CUDA worker has a same interface of CPU worker. In GPGPU small size of
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
32 code and data are transferred to GPU and these are executed in
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
33 parallel.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
34 Code Gear and data Gear are fit in this computational model.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
35 Task is a meta data Gear which has set of data Gear and code Gear.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
36 A stub meta code Gear extracts necessary data Gear and passes to
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
37 normal level code Gear. In CUDA Worker, initialization of CUDA is
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
38 performed.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
39 In the stub meta code Gear, data Gaers and code Gears are transferred
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
40 to the GPU and executed.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
41 CUDA kernel code is very similar to code Gears representation, so we
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
42 can generate automatically but it is possible to use CUDA specific
10
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
43 functions.
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
44 We use CMake in our implementation.
10
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
45 A CUDA function can be switched with a flag.
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
46 CMake macros are used to generate stubs and context.
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
47 We check to basic execution of Gears task. \\
10
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
48
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
49 %Gears OS
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
50 %interface のていぎ
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
51 %Code Gear モジュール化
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
52 %CPUworkerをインターフェースにした
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
53 %CUDAworkerの実装
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
54 %GPUでの実行こーどは転送したデータに対する比較的短いコードの実行
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
55 %これはdata Gear code Gearに対応している、実装しやすい
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
56 %GPUにデータを転送し、GPU側でTaskを実行する部分はmeta計算として実装する
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
57 %Taskは実行contextに格納されたコードとデータの集合である
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
58 %その中から必要なデータを呼び出してノーマルレベルのコードに引き渡す部分
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
59 %をmeta Code Gearで記述し、それをstubと呼ぶ
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
60 %stub 部分でGPUにデータを転送し、コードの実行を行う
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
61 %ノーマルレベルのコードはGPU内のコードに近いので自動生成を行うこともで
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
62 %きる。CUDa 固有の機能をそのまま記述しても構わないが既存のCPUでは起動で
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
63 %きない場合がある。
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
64 %実装はCMakeを用いてCUDAを使用する場合と使用しない場合をフラグで切り替
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
65 %えるようにした。
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
66 %CMakeのマクロを用いて、stubなどの生成を行なっている。
87e0b63676a4 Englesh abst
ikkun
parents: 9
diff changeset
67 %今回CUDA上でのTaskの基本的な実行を確認することができた。
9
ikkun
parents:
diff changeset
68
ikkun
parents:
diff changeset
69 \end{英語abst}]
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
70
9
ikkun
parents:
diff changeset
71 \thispagestyle{fancy}
ikkun
parents:
diff changeset
72
ikkun
parents:
diff changeset
73 \section{Gears OS}
ikkun
parents:
diff changeset
74 Gears OS では Gear という単位を用いてプログラムを Code Gear, Data Gear
ikkun
parents:
diff changeset
75 に細かく分割する。
ikkun
parents:
diff changeset
76 接続する Gear を変更することでプログラムの振る舞いを変更することを可能
ikkun
parents:
diff changeset
77 にする柔軟性、メタ計算による並行制御,モデル検査を用いた信頼性の確保を目的とする。
ikkun
parents:
diff changeset
78 本研究では現状のGears OS の GPGPU サポートを行う。
ikkun
parents:
diff changeset
79 \section{Code Gear と Data Gear}
ikkun
parents:
diff changeset
80 Code Gear は処理の基本として、 Input Data Gear を参照し、一つまたは複数の Output Data Gear に書き込む。また、接続された Data Gear 以外には参照を行わない。
ikkun
parents:
diff changeset
81 Input Data Gear と Output Data Gear の2つによって、Code Gear の Data に対す
ikkun
parents:
diff changeset
82 る依存関係を解決し、 Code Gear の並列実行を可能とする。
ikkun
parents:
diff changeset
83 Code Gear はCbCを元に記述されており、処理の移行はfunction callではないので、呼び出し元に戻る概念はない。
ikkun
parents:
diff changeset
84 その代わりに、次に実行する Code Gear を軽量継続の goto で指定する。
ikkun
parents:
diff changeset
85 Data Gear は、int や文字列などの Primitive Data Type の組み合わせ(struct)である。
ikkun
parents:
diff changeset
86 Data Gearは様々な型を持つunionとして定義される。
ikkun
parents:
diff changeset
87 Gear の特徴の一つはその処理が Code Gear, Data Gear に閉じていることにある。
ikkun
parents:
diff changeset
88 これにより、Code Gear の実行時間、メモリ使用量を予測可能なものにする。
ikkun
parents:
diff changeset
89
ikkun
parents:
diff changeset
90 \section{GPGPUとは}
ikkun
parents:
diff changeset
91 GPGPU とは、元々は画像出力や画像編集などの画像処理に用いられるGPUを画像処理以外に利用する技術の事である。\\
ikkun
parents:
diff changeset
92 画像の編集はピクセル毎に行われるため多大な数の処理を行う必要があるが、 GPU は CPU に比べコア数が多数あり、多数のコアで同時に計算することによって CPU よりも多数の並列な処理を行う事が出来る。\\
ikkun
parents:
diff changeset
93 これによってGPUは画像処理のような多大な処理を並列処理することで、 CPU で処理するよりも高速に並列処理することが出来る。
ikkun
parents:
diff changeset
94 しかし、GPU のコアはCPUのコアに比べ複雑な計算は出来ない構造であるため単純計算しか出来ない、また一般的にユーザーから GPU 単体に直接命令を書き込むことも出来ないなどの問題点も存在する。
ikkun
parents:
diff changeset
95 GPGPU は CPU によって単純計算のTaskを GPU に振り分ける事によって、 GPU の問題点を解決しつつ、高速な並列処理を行うことである。
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
96 Gears OS による GPU 処理は図\ref{fig:gpgpu}の様になり、Worker によって Taskを受け渡し、GPUWorker によって並列処理が行われる。また Data Gear へのアクセスは接続された Code Gear からのみであるので並列処理中に変数の値が書き変わることがない。
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
97
9
ikkun
parents:
diff changeset
98 \begin{figure}[ht]
ikkun
parents:
diff changeset
99 \centering
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
100 \includegraphics[width=90mm]{pic/gearsos.pdf}
9
ikkun
parents:
diff changeset
101 \caption{Gears OS による GPGPU}
ikkun
parents:
diff changeset
102 \label{fig:gpgpu}
ikkun
parents:
diff changeset
103 \end{figure}
ikkun
parents:
diff changeset
104
ikkun
parents:
diff changeset
105 \section{CUDAWoker の実装}
ikkun
parents:
diff changeset
106 CUDAWorker は Task を queue から受け取り、 thread を作成する。\\
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
107 その後 Task を まとめて CUDATask としてCUDAに送る。CUDATwice の処理が終わるまで sleep で待機し、CUDATwiceから Task を受け取る。
9
ikkun
parents:
diff changeset
108
ikkun
parents:
diff changeset
109 \section{CUDATwiceの実装}
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
110 CUDATwice は GPU 側で行われる処理で、値を2倍する処理を繰り返すプログラムとなっており、
9
ikkun
parents:
diff changeset
111 \section{CMakeによるコンパイル}
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
112 CMake はビルド自動化ツールであり、プログラムをコンパイル行う際にライブラリや動作環境によって様々な設定を行う必要がありますが、 CMake にはそれらのファイルやライブラリを探し出して実行することが出来ます。\\
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
113 CMake のビルドは2段階からなり、 CMake の制御ファイルの CMakeList.txt によってビルドするファイルを指定でき、指定されたファイルをビルドする際にはまずビルドに必要なライブラリやファイルを探し、通常のビルド環境用のビルドファイルを作成し、次にビルドするファイルにあったビルドを行います。
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
114 CMake は Windows や Linux 等、複数のOS の環境に対応している他、様々なコンパイルオプションがあり、クロスコンパイルや、ユーザーがコンパイルのルールを追加することで特殊なコンパイラや OS にも対応することが出来る。\\
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
115 今回の研究では、CbC という本研究室独自の言語と CUDA 専用コンパイラの nvcc を両立させる必要があり、CMakeは一般的に1つのコンパイラしか同時に扱えないため、CMakeでサポートされているマクロを用いて同時にコンパイルすることが出来た。
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
116 \section{まとめ}
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
117 本研究室で研究している Code Gear Data Gear を用いて記述されたプログラムをCMakeを用いてコンパイルすることで CUDA 上で動かすことが出来た。\\
9
ikkun
parents:
diff changeset
118 \section{今後の課題}
11
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
119 Gears OS の並列性や信頼性を検証するために今回例題として使用した twice とは違う、依存関係のある例題を用いた検証を行いたい。
f1307a309875 addpresen
ikkun
parents: 10
diff changeset
120 また、並列処理による処理速度の向上の計測を行っていきたい。
9
ikkun
parents:
diff changeset
121 \begin{thebibliography}{10}
ikkun
parents:
diff changeset
122 \bibitem{cerium}
ikkun
parents:
diff changeset
123 宮國 渡,河野真治,神里 晃,杉山千秋:Cell 用の Fine-grain Task Manager
ikkun
parents:
diff changeset
124 の実装,情報処理学会
ikkun
parents:
diff changeset
125 システムソフトウェアとオペレーティング・システム研究会(OS) (2008).
ikkun
parents:
diff changeset
126
ikkun
parents:
diff changeset
127 \bibitem{alice}
ikkun
parents:
diff changeset
128 赤嶺一樹,河野真治:DataSegment API
ikkun
parents:
diff changeset
129 を用いた分散フレームワークの設計,日本ソフトウェア科学会第28回大会論文集
ikkun
parents:
diff changeset
130 (2011).
ikkun
parents:
diff changeset
131
ikkun
parents:
diff changeset
132 \bibitem{gears}
ikkun
parents:
diff changeset
133 伊波 立樹, 東恩納 琢偉,河野 真治:Code Gear、Data Gear に基づく OS のプロトタイプ、
ikkun
parents:
diff changeset
134 情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS) (2016).
ikkun
parents:
diff changeset
135
ikkun
parents:
diff changeset
136 \bibitem{segment}
ikkun
parents:
diff changeset
137 河野真治,杉本 優:Code Segment と Data Segment
ikkun
parents:
diff changeset
138 によるプログラミング手法,第54回プログラミング・シンポジウム (2013).
ikkun
parents:
diff changeset
139
ikkun
parents:
diff changeset
140 \bibitem{monad}
ikkun
parents:
diff changeset
141 Eugenio Moggi, Notion of Computation and Monads(1991)
ikkun
parents:
diff changeset
142
ikkun
parents:
diff changeset
143 \bibitem{cbc-llvm}
ikkun
parents:
diff changeset
144 徳森海斗,河野真治:Continuation based C の LLVM/clang 3.5
ikkun
parents:
diff changeset
145 上の実装について,情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS)
ikkun
parents:
diff changeset
146 (2014).
ikkun
parents:
diff changeset
147
ikkun
parents:
diff changeset
148 \bibitem{opencl}
ikkun
parents:
diff changeset
149 {Aaftab Munshi, Khronos OpenCL Working Group}: {\em {The OpenCL Specification Version 1.0}} (2007).
ikkun
parents:
diff changeset
150
ikkun
parents:
diff changeset
151 \bibitem{cuda}
ikkun
parents:
diff changeset
152 : {CUDA}, {https://developer.nvidia.com/category/zone/cuda-zone/}.
ikkun
parents:
diff changeset
153
ikkun
parents:
diff changeset
154 \end{thebibliography}
ikkun
parents:
diff changeset
155 \end{document}