Mercurial > hg > Papers > 2015 > yuhi-master
annotate paper/abstract.tex @ 10:1519674c30ab
dragon and firefly spec
author | Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sat, 31 Jan 2015 15:58:41 +0900 |
parents | aae08d907517 |
children | e735d95e48d8 |
rev | line source |
---|---|
0 | 1 \begin{abstract} |
10
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
2 マルチプラットフォーム対応並列プログラミングフレームワークに関する研究を行った。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
3 本研究室で開発している Cerium に並列プログラミングフレームワークに必要と考えられる機能を追加していった。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
4 本来 Cerium は Cell Broad band Engine 用のフレームワークであったが、 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
5 更なる並列度のためにマルチコアと GPU における実行を可能にした。マルチコアは SynchronizedQueue による対応、 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
6 GPU は OpenCL と CUDA を用いた対応を行った。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
7 また、マルチコアや GPU での並列処理を行ったとしても、I/Oの動作への負担が大きければ、プログラムの処理は高速にならない。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
8 従来はファイル読み込みを mmap で実装していたが、 Blocked Read による並列処理向けのI/Oの実装を行った。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
9 プログラムにおいて、小さいサイズの malloc を繰り返し行うとフラグメンテーションにより処理性能が著しく落ちることがある。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
10 Cerium において適切なメモリ管理ができるように改良を行った。 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
11 これらの改良を WordCount 、FFT 、 Sortを例題に性能向上を測定し、 |
1519674c30ab
dragon and firefly spec
Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
12 マルチプラットフォーム対応並列プログラミングフレームワークに必要な機構や API に関する考察を行う。 |
0 | 13 \end{abstract} |