# HG changeset patch
# User Yutaka_Kinjyo
# Date 1284332247 -32400
# Node ID 3a5444f090c86d842fe5b18649b78555837938d2
# Parent c4fdeadf42ddba2b519faff0a8ba14971d860cb7
fix
diff -r c4fdeadf42dd -r 3a5444f090c8 presen/presen.html
--- a/presen/presen.html Mon Sep 13 00:04:23 2010 +0900
+++ b/presen/presen.html Mon Sep 13 07:57:27 2010 +0900
@@ -86,7 +86,7 @@
Fine grain Task Manager Cerium のチューニング
-金城裕
+Yutaka Kinjyo, Shinji Kono
琉球大学大学院理工学研究科情報工学専攻並列信頼研
@@ -109,23 +109,23 @@
-
-
発表の流れ
+
+
-
-- Cellとは
-- Ceriumとは
-- CeriumにおけるTask
-- TaskArray
-
-- WordCountのTaskArray化
-- レンダリングエンジンのTaskArray化
-
-- 結果
-- まとめ
-
+
+
+
+
+
+
+
+
+
+
+
+
-
+
Cellとは
@@ -327,7 +327,6 @@
-
Sort
@@ -370,8 +369,8 @@
mail wait |
なし |
-0.82%% |
-0.17%% |
+0.82% |
+0.17% |
Sortの速度比較
@@ -387,67 +386,6 @@
-
TaskArray
-
-
SPEのMailの待ち時間を解消するためにTaskArrayを提案、実装した
-
-
-- TaskArrayは複数のTaskを1つにまとめることができる
-- Task毎のMail通知がTaskArray毎のMail通知になる
-- 依存関係のグルーピングができる
-
-
-
-
- |
-
-
-
-
-
-
TaskArray
-
-期待される効果
-
-
-- Mailの数が減り、SPEのMail待ちのタイミングが減る
-- Mail待ちが減るので、SPEの稼働率が向上する
-
-
-
-
- |
-
-
-
-
-
-
TaskArray
-
-
レンダリングエンジンのTaskと、WordCountのTaskの一部をTaskArray化した。
-その結果を報告する
-
-レンダリングエンジンのTask内容
-
-
- - CreatePolygonTask
-
- - CreateSpanTask
-
- - Polygonを水平な線(Span)に分割する
-
- - DrawSpanTask(TaskArray化)
-
-
-
-
-
-
-
WordCountのTask内容
@@ -486,22 +424,78 @@
WordCount
-計測条件
+
+
+
+ |
+WordCount |
+
+
+time |
+2.102s |
+
+
+dma wait |
+12% |
+
+
+
+mail wait |
+7% |
+
+
+WordCountの速度
+
+
- - TaskArrayのサイズは64
- - Word count対象は166Mのテキスト
- - TaskArrayの適応の有無を比較
+- Sort に比べて、dima wait, mail wait の割合が大きい
+
+
TaskArray
+
SPEのMailの待ち時間を解消するためにTaskArrayを提案、実装した
+
+
+- TaskArrayは複数のTaskを1つにまとめることができる
+- Task毎のMail通知がTaskArray毎のMail通知になる
+- 依存関係のグルーピングができる
+
+
+
+
+ |
+
+
+
+
+
+
TaskArray
+
+期待される効果
+
+
+- Mailの数が減り、SPEのMail待ちのタイミングが減る
+- Mail待ちが減るので、SPEの稼働率が向上する
+
+
+
+
+ |
+
+
+
WordCount
-time : 実行時間
+
+
|
@@ -517,13 +511,13 @@
dma wait |
12% |
-17(+5)% |
+17(+5)% |
mail wait |
7% |
-2(-5)% |
+2(-5)% |
WordCountの比較
@@ -557,6 +551,7 @@
- 一度にすべてのTaskを生成せず、一定のTaskを生成、実行を繰り返す
- 同期する地点を設け、特定のSPEがはしり過ぎないようにする
+
@@ -602,6 +597,32 @@
+
+
+
TaskArray
+
+
レンダリングエンジンのTaskの一部をTaskArray化した
+
+レンダリングエンジンのTask内容
+
+
+ - CreatePolygonTask
+
+ - CreateSpanTask
+
+ - Polygonを水平な線(Span)に分割する
+
+ - DrawSpanTask(TaskArray化)
+
+
+
+
+
+
レンダリングエンジン
@@ -612,8 +633,6 @@
- FPS : 一秒間に表示するFrame数
-- dma wait : dma転送の待ち時間の割合
-- mail wait : mailの待ち時間の割合
- TaskArrayの適応の有無を比較
- TaskArrayのサイズは8
@@ -655,7 +674,8 @@
- mail wait 割合が減少し、それに伴ってFPSも増加
- レンダリングエンジンの場合、PPE側で実行するTaskがある
- - PPEのMailチェックがおくれることがあるので、TaskArrayを用いてMailを減らすことは効果がある
+ - PPEのMailチェックがおくれることがあるので、TaskArrayの効果がある
+ - Mail wait の細かい内訳はまだわかっていない
@@ -665,11 +685,11 @@
今後のMail待ち時間削減
-
- PPE側のTaskをSPEに任せ、PPEの負担をへらす
- 別スレッドでMailを監視する
- 他のTaskもTaskArray化する
+ - Mail wait の細かい内訳を調べる
@@ -678,14 +698,14 @@
まとめ
-
- 複数のTaskをまとめるTaskArrayを提案、実装した。
- - PPE側が忙しい場合、Mail待ち時間の削減にTaskArrayの効果がよりみられる
+ - PPE側が忙しい場合、Mail待ち時間の削減にTaskArrayの効果がみられる
- マッピングの方法、Taskのスケジューリングを工夫して局所性を維持することでdma転送時間を削減できる
- - アムダールの法則から、SPEの稼働率を上げることで処理速度の向上に繋がる
- - それぞれの待ち時間のチューニングは必要である
+ - SPEの稼働率を上げることで処理速度の向上に繋がる
+ - 待ち時間のチューニングは必要である
+