Sort

+ +TaskManagerを用いたsortの例題を紹介する
+CellのSPE6基、1基、Mac OS X と比較する。 + +

time : 実行時間
dma wait : dma転送の待ち時間の割合
mail wait : mailの待ち時間の割合
sortする対象は30,000個のランダムな値
Quick sortを行う

+ +

Sort

+ + + + + + + + + + + + + + + + + + + + + + + + + + + + + +

Sortの速度比較
	Mac OS X	Cell(SPE6)	Cell(SPE1)
time	24.9s	11.0s	65.8s
dma wait	なし	0.41%	0.39%
mail wait	なし	0.82%%	0.17%%

+ +

SPEの稼働率は約98%。
Sortの場合、SPEの待ち時間がほとんど無く高速に動作する
WordCount,レンダリングエンジンの場合は待ち時間がはいる

+ +

TaskArray

@@ -354,8 +412,6 @@

Mailの数が減り、SPEのMail待ちのタイミングが減る
Mail待ちが減るので、SPEの稼働率が向上する
また、PPE側のMailチェックの時間も減る
結果、処理速度が向上する

@@ -392,78 +448,6 @@

レンダリングエンジン

- -DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する -例題を対象に計測した。

- -計測条件 - -

FPS : 一秒間に表示するFrame数
dma wait : dma転送の待ち時間の割合
mail wait : mailの待ち時間の割合
TaskArrayの適応の有無を比較
TaskArrayのサイズは8

- -

レンダリングエンジン

- -

- - - - - - - - - - - - - - - - - - - - - - - - - -

レンダリングエンジンの比較
	Task	TaskArray
FPS	3.94	4.32
dma wait	0.06%	0.07%
mail wait	55%	42%(-13%)

- -

mail wait 割合が減少し、それに伴ってFPSも増加
レンダリングエンジンの場合、PPE側で実行するTaskがある
PPEのMailチェックがおくれることがあるので、TaskArrayを用いてMailを減らすことは効果がある

- -

レンダリングエンジン

- -今後のMail待ち時間削減
- - -

PPE側のTaskをSPEに任せ、PPEの負担をへらす
別スレッドでMailを監視する
他のTaskもTaskArray化する

- -

WordCountのTask内容 @@ -619,6 +603,79 @@

レンダリングエンジン

+ +DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する +例題を対象に計測した。

+ +計測条件 + +

FPS : 一秒間に表示するFrame数
dma wait : dma転送の待ち時間の割合
mail wait : mailの待ち時間の割合
TaskArrayの適応の有無を比較
TaskArrayのサイズは8

+ +

レンダリングエンジン

+ + + + + + + + + + + + + + + + + + + + + + + + + + + +

レンダリングエンジンの比較
	Task	TaskArray
FPS	3.94	4.32
dma wait	0.06%	0.07%
mail wait	55%	42%(-13%)

+ +

mail wait 割合が減少し、それに伴ってFPSも増加
レンダリングエンジンの場合、PPE側で実行するTaskがある
PPEのMailチェックがおくれることがあるので、TaskArrayを用いてMailを減らすことは効果がある

+ +

レンダリングエンジン

+ +今後のMail待ち時間削減
+ + +

PPE側のTaskをSPEに任せ、PPEの負担をへらす
別スレッドでMailを監視する
他のTaskもTaskArray化する

+ +

+ + +

まとめ

@@ -627,6 +684,8 @@

複数のTaskをまとめるTaskArrayを提案、実装した。

PPE側が忙しい場合、Mail待ち時間の削減にTaskArrayの効果がよりみられる

マッピングの方法、Taskのスケジューリングを工夫して局所性を維持することでdma転送時間を削減できる

アムダールの法則から、SPEの稼働率を上げることで処理速度の向上に繋がる

それぞれの待ち時間のチューニングは必要である