view prepaper/Introduction.tex @ 6:e789ba398c3f

add pdf
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Wed, 26 Feb 2014 01:15:05 +0900
parents a1d0cc36cc7c
children 930d0024bc6f
line wrap: on
line source

\section{研究目的}
PS3 および Linux、Mac OS X 上で動く並列プログラミングフレームワーク、Cerium Task Manager\cite{gongo:2008a}の開発・完了を行なっている。

Cell だけでなく、GPU のような異なるアーキテクチャを搭載した CPU、つまりヘテロジニアスな CPU が増えてきた。
GPU の普及と高性能化にともない、GPU の演算資源を画像処理以外の目的にも利用する GPGPU(GPU による汎目的計算)が注目されている\cite{FFTonGPU}。

特定の計算に特化した Task の生成やスケジューリングを行い、高い並列度を出すという研究は様々な分野で行われている。
特定の計算に限らず、GPU を用いて汎用計算できるフレームワークを Cerium Task Manager は目指している。
しかし、GPU のみで計算を行った場合、Task によっては並列度が出ない場合がある。
GPU はデータ並列による実行が推奨されており、OpenCL および CUDA にはそのための API が存在する。
また GPU は CPU とメモリ空間が異なるため、データにアクセスするためにはメモリ空間ごとコピーする必要がある。
このデータ転送部分が大きなオーバーヘッドになる。
この問題を解決するために OpenCL および CUDA を用いて、自動でデータ転送をオーバーラップし、パイプライン実行を行うよう Cerium を改良した。