view paper/abstract.tex @ 16:d7cf4a51597f

parallel IO
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Tue, 10 Feb 2015 14:06:53 +0900
parents e735d95e48d8
children 5ad80050329e
line wrap: on
line source

\begin{abstract}
\if0
マルチプラットフォーム対応並列プログラミングフレームワークに関する研究を行った。
本研究室で開発している Cerium に並列プログラミングフレームワークに必要と考えられる機能を追加していった。
本来 Cerium は Cell Broad band Engine 用のフレームワークであったが、
更なる並列度のためにマルチコアと GPU における実行を可能にした。マルチコアは SynchronizedQueue による対応、
 GPU は OpenCL と CUDA を用いた対応を行った。
また、マルチコアや GPU での並列処理を行ったとしても、I/Oの動作への負担が大きければ、プログラムの処理は高速にならない。
従来はファイル読み込みを mmap で実装していたが、 Blocked Read による並列処理向けのI/Oの実装を行った。
プログラムにおいて、小さいサイズの malloc を繰り返し行うとフラグメンテーションにより処理性能が著しく落ちることがある。
Cerium において適切なメモリ管理ができるように改良を行った。
これらの改良を WordCount 、FFT 、 Sortを例題に性能向上を測定し、
マルチプラットフォーム対応並列プログラミングフレームワークに必要な機構や API に関する考察を行う。
\fi
\end{abstract}