Mercurial > hg > Papers > 2015 > yuhi-master
annotate paper/conclusion.tex @ 19:79d16cee0afd
Benchmark gpu.minor fix abstruct
author | Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Fri, 13 Feb 2015 09:29:41 +0900 |
parents | aae08d907517 |
children | 7c5bf9ec7eb3 |
rev | line source |
---|---|
0 | 1 \chapter{結論} \label{chapter:conclusion} |
2 | |
3 \section{まとめ} | |
19
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
4 本研究室で開発している Cerium を用いて、 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
5 マルチプラットフォーム対応並列プログラミングフレームワークに関する研究を行った。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
6 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
7 マルチプラットフォームへの対応として、マルチコア CPU と GPU における実行を可能にした。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
8 マルチコア CPU は SynchronizedQueue 、 GPU は OpenCL と CUDA を用いて対応した。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
9 更に、 Blocked Read による並列処理向けのI/Oの実装を行った。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
10 これらの追加した機能を WordCount 、FFT 、 Sort を例題に性能を測定できた。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
11 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
12 ベンチマークの結果から、GPU による並列処理を行う場合データ並列による実行が不可欠であることがわかった。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
13 また、GPU は SharedMemory でないため、入出力がネックになる場合が多い。 |
79d16cee0afd
Benchmark gpu.minor fix abstruct
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
14 それらのオーバヘッドを吸収するために GPU 制御のコマンドはパイプライン形式で実行していくのが望ましい。 |
0 | 15 |
16 \section{今後の課題} |