Papers/2015/yuhi-master: paper/conclusion.tex annotate

annotate paper/conclusion.tex @ 19:79d16cee0afd

Benchmark gpu.minor fix abstruct

author	Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date	Fri, 13 Feb 2015 09:29:41 +0900
parents	aae08d907517
children	7c5bf9ec7eb3

rev	line source
0 aae08d907517 first commit Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	1 \chapter{結論} \label{chapter:conclusion}
aae08d907517 first commit Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	2
aae08d907517 first commit Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	3 \section{まとめ}
19 79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	4 本研究室で開発している Cerium を用いて、
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	5 マルチプラットフォーム対応並列プログラミングフレームワークに関する研究を行った。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	6
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	7 マルチプラットフォームへの対応として、マルチコア CPU と GPU における実行を可能にした。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	8 マルチコア CPU は SynchronizedQueue 、 GPU は OpenCL と CUDA を用いて対応した。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	9 更に、 Blocked Read による並列処理向けのI/Oの実装を行った。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	10 これらの追加した機能を WordCount 、FFT 、 Sort を例題に性能を測定できた。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	11
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	12 ベンチマークの結果から、GPU による並列処理を行う場合データ並列による実行が不可欠であることがわかった。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	13 また、GPU は SharedMemory でないため、入出力がネックになる場合が多い。
79d16cee0afd Benchmark gpu.minor fix abstruct Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	14 それらのオーバヘッドを吸収するために GPU 制御のコマンドはパイプライン形式で実行していくのが望ましい。
0 aae08d907517 first commit Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	15
aae08d907517 first commit Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	16 \section{今後の課題}