Fine grain Task Manager Cerium のチューニング

Yutaka Kinjyo, Shinji Kono

琉球大学大学院理工学研究科情報工学専攻並列信頼研

研究目的 と 背景

現在 Cell/PS3またはMac OS X上で動作するOpen CL 的なFine Grain Task Manager である Cerium Task Manager を開発中である。

本研究ではその待ち時間を削減するTask array、メモリのアクセス方法を提案し実装した。その効果について報告する

Cellとは

Cell(Cell Broadband Engine)とはソニー、東芝、IBM社の3社が共同開発したマイクロプロセッサ
Cellは1基の制御系のプロセッサコアPPEと、8基の演算系プロセッサコアSPE で構成される(Ceriumで扱えるSPEの数は6基)。

Ceriumとは

Ceriumとは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。 以下の3つの要素から構成されている。

Ceriumとは

Ceriumとは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。 以下の3つの要素から構成されている。

TaskManager

CeriumにおけるTask

TaskはTaskManagerを使って生成する。Taskを生成する際に以下のような要素が 設定可能である。

CeriumにおけるTask

Dependency

CeriumにおけるTask

Mail機能

CeriumにおけるTask

Mail機能

Taskの送信

SPEの待ち時間

SPEはデータの転送とMailの読み込み、書き込みの際に待ち時間が生じることがある。

Sort

TaskManagerを用いたsortの例題を紹介する
CellのSPE6基、1基、Mac OS X と比較する。

Sort

Mac OS X Cell(SPE6) Cell(SPE1)
time 24.9s 11.0s 65.8s
dma wait なし 0.41% 0.39%
mail wait なし 0.82% 0.17%
Sortの速度比較

WordCountのTask内容

WordCount

WordCount

ファイルの大きさは166MB
WordCount
time 2.102s
dma wait 12%
mail wait 7%
WordCountの速度

TaskArray

SPEのMailの待ち時間を解消するためにTaskArrayを提案、実装した

TaskArray

期待される効果

WordCount

Task TaskArray
time 2.102s 2.083s
dma wait 12% 17(+5)%
mail wait 7% 2(-5)%
WordCountの比較

WordCount

WordCount の dma wait

WordCount

メモリアクセスの局所性を維持するために
一度に生成 分割して生成
time 2.083s 2.481s
dma wait 17% 9(-8)%
mail wait 2% 22(+20)%
WordCountの比較

WordCount

WordCount の Mail wait

TaskArray

レンダリングエンジンのTaskの一部をTaskArray化した

レンダリングエンジンのTask内容

レンダリングエンジン

DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する 例題を対象に計測した。

計測条件

レンダリングエンジン

Task TaskArray
FPS 3.94 4.32
dma wait 0.06% 0.07%
mail wait 55% 42%(-13%)
レンダリングエンジンの比較

レンダリングエンジン

今後のMail待ち時間削減

まとめ

end