# HG changeset patch
# User Yutaka_Kinjyo
# Date 1284303863 -32400
# Node ID c4fdeadf42ddba2b519faff0a8ba14971d860cb7
# Parent 90ec4863ce0021becc2f73bcd59046bda0e8510c
fix
diff -r 90ec4863ce00 -r c4fdeadf42dd presen/presen.html
--- a/presen/presen.html Sun Sep 12 17:03:20 2010 +0900
+++ b/presen/presen.html Mon Sep 13 00:04:23 2010 +0900
@@ -104,7 +104,7 @@
メインメモリ上の Task を各 Core が受け取る際や、その終了を通知する際に待ち時間が生じる。
-本研究ではその待ち時間を削減するTask arrayを提案し実装した。その効果について報告する
+本研究ではその待ち時間を削減するTask array、メモリのアクセス方法を提案し実装した。その効果について報告する
@@ -309,7 +309,6 @@
SPEはデータの転送とMailの読み込み、書き込みの際に待ち時間が生じることがある。
-
-
@@ -328,6 +327,65 @@
+
+
+
Sort
+
+TaskManagerを用いたsortの例題を紹介する
+CellのSPE6基、1基、Mac OS X と比較する。
+
+
+- time : 実行時間
+- dma wait : dma転送の待ち時間の割合
+- mail wait : mailの待ち時間の割合
+- sortする対象は30,000個のランダムな値
+- Quick sortを行う
+
+
+
+
+
+
+
Sort
+
+
+
+ |
+Mac OS X |
+Cell(SPE6) |
+Cell(SPE1) |
+
+
+time |
+24.9s |
+11.0s |
+65.8s |
+
+
+dma wait |
+なし |
+0.41% |
+0.39% |
+
+
+mail wait |
+なし |
+0.82%% |
+0.17%% |
+
+
+Sortの速度比較
+
+
+
+
+- SPEの稼働率は約98%。
+- Sortの場合、SPEの待ち時間がほとんど無く高速に動作する
+- WordCount,レンダリングエンジンの場合は待ち時間がはいる
+
+
+
+
TaskArray
@@ -354,8 +412,6 @@
- Mailの数が減り、SPEのMail待ちのタイミングが減る
- Mail待ちが減るので、SPEの稼働率が向上する
-- また、PPE側のMailチェックの時間も減る
-- 結果、処理速度が向上する
@@ -392,78 +448,6 @@
-
レンダリングエンジン
-
-DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する
-例題を対象に計測した。
-
-計測条件
-
-
-- FPS : 一秒間に表示するFrame数
-- dma wait : dma転送の待ち時間の割合
-- mail wait : mailの待ち時間の割合
-- TaskArrayの適応の有無を比較
-- TaskArrayのサイズは8
-
-
-
-
-
-
-
レンダリングエンジン
-
-
-
- |
-Task |
-TaskArray |
-
-
-FPS |
-3.94 |
-4.32 |
-
-
-
-dma wait |
-0.06% |
-0.07% |
-
-
-
-mail wait |
-55% |
-42%(-13%) |
-
-
-レンダリングエンジンの比較
-
-
-
-
- - mail wait 割合が減少し、それに伴ってFPSも増加
- - レンダリングエンジンの場合、PPE側で実行するTaskがある
- - PPEのMailチェックがおくれることがあるので、TaskArrayを用いてMailを減らすことは効果がある
-
-
-
-
-
-
レンダリングエンジン
-
-今後のMail待ち時間削減
-
-
-
- - PPE側のTaskをSPEに任せ、PPEの負担をへらす
- - 別スレッドでMailを監視する
- - 他のTaskもTaskArray化する
-
-
-
-
-
WordCountのTask内容
@@ -619,6 +603,79 @@
+
レンダリングエンジン
+
+DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する
+例題を対象に計測した。
+
+計測条件
+
+
+- FPS : 一秒間に表示するFrame数
+- dma wait : dma転送の待ち時間の割合
+- mail wait : mailの待ち時間の割合
+- TaskArrayの適応の有無を比較
+- TaskArrayのサイズは8
+
+
+
+
+
+
+
レンダリングエンジン
+
+
+
+ |
+Task |
+TaskArray |
+
+
+FPS |
+3.94 |
+4.32 |
+
+
+
+dma wait |
+0.06% |
+0.07% |
+
+
+
+mail wait |
+55% |
+42%(-13%) |
+
+
+レンダリングエンジンの比較
+
+
+
+
+ - mail wait 割合が減少し、それに伴ってFPSも増加
+ - レンダリングエンジンの場合、PPE側で実行するTaskがある
+ - PPEのMailチェックがおくれることがあるので、TaskArrayを用いてMailを減らすことは効果がある
+
+
+
+
+
+
レンダリングエンジン
+
+今後のMail待ち時間削減
+
+
+
+ - PPE側のTaskをSPEに任せ、PPEの負担をへらす
+ - 別スレッドでMailを監視する
+ - 他のTaskもTaskArray化する
+
+
+
+
+
+
まとめ
@@ -627,6 +684,8 @@
- 複数のTaskをまとめるTaskArrayを提案、実装した。
- PPE側が忙しい場合、Mail待ち時間の削減にTaskArrayの効果がよりみられる
- マッピングの方法、Taskのスケジューリングを工夫して局所性を維持することでdma転送時間を削減できる
+ - アムダールの法則から、SPEの稼働率を上げることで処理速度の向上に繋がる
+ - それぞれの待ち時間のチューニングは必要である