10
|
1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
|
|
2 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
|
|
3
|
|
4 <html xmlns="http://www.w3.org/1999/xhtml">
|
|
5 <META http-equiv="Content-Type" content="text/html; charset=utf-8">
|
|
6
|
|
7 <head>
|
|
8 <title>発表資料</title>
|
|
9 <!-- metadata -->
|
|
10 <meta name="generator" content="S5" />
|
|
11 <meta name="version" content="S5 1.1" />
|
|
12 <meta name="presdate" content="20050728" />
|
|
13 <meta name="author" content="Eric A. Meyer" />
|
|
14 <meta name="company" content="Complex Spiral Consulting" />
|
|
15 <!-- configuration parameters -->
|
|
16 <meta name="defaultView" content="slideshow" />
|
|
17 <meta name="controlVis" content="hidden" />
|
|
18 <!-- style sheet links -->
|
|
19 <link rel="stylesheet" href="ui/default/slides.css" type="text/css" media="projection" id="slideProj" />
|
|
20 <link rel="stylesheet" href="ui/default/outline.css" type="text/css" media="screen" id="outlineStyle" />
|
|
21 <link rel="stylesheet" href="ui/default/print.css" type="text/css" media="print" id="slidePrint" />
|
|
22 <link rel="stylesheet" href="ui/default/opera.css" type="text/css" media="projection" id="operaFix" />
|
|
23 <!-- S5 JS -->
|
|
24 <script src="ui/default/slides.js" type="text/javascript"></script>
|
|
25
|
|
26 <style type="text/css">
|
|
27 body {
|
|
28 font-size: 100%;
|
|
29 }
|
|
30 p.ex10 { font-size: 2.0em; }
|
|
31 p.ex9 { font-size: 1.9em; }
|
|
32 p.ex8 { font-size: 1.8em; }
|
|
33 p.ex7 { font-size: 1.7em; }
|
|
34 p.ex6 { font-size: 1.6em; }
|
|
35 p.ex5 { font-size: 1.5em; }
|
|
36 p.ex4 { font-size: 1.4em; }
|
|
37 p.ex3 { font-size: 1.3em; }
|
|
38 p.ex2 { font-size: 1.2em; }
|
|
39 p.ex1 { font-size: 1.1em; }
|
|
40 p.ex0 { font-size: 1.0em; }
|
|
41 p.ex05 { font-size: 0.5em; }
|
|
42
|
|
43 span.classifier {
|
|
44 font-family: sans-serif ;
|
|
45 font-style: oblique }
|
|
46
|
|
47 span.classifier-delimiter {
|
|
48 font-family: sans-serif ;
|
|
49 font-weight: bold }
|
|
50
|
|
51 span.interpreted {
|
|
52 font-family: sans-serif }
|
|
53
|
|
54 span.option {
|
|
55 white-space: nowrap }
|
|
56
|
|
57 span.pre {
|
|
58 white-space: pre }
|
|
59
|
|
60 span.problematic {
|
|
61 color: red }
|
|
62
|
|
63 span.section-subtitle {
|
|
64 /* font-size relative to parent (h1..h6 element) */
|
|
65 font-size: 80% }
|
|
66
|
|
67 </style>
|
|
68 </head>
|
|
69
|
|
70
|
|
71 <body>
|
|
72
|
|
73 <div class="layout">
|
|
74 <div id="controls"><!-- DO NOT EDIT --></div>
|
|
75 <div id="currentSlide"><!-- DO NOT EDIT --></div>
|
|
76 <div id="header"></div>
|
|
77 <div id="footer">
|
|
78 <!--<h1>Cell上のソフトウェアレンダリングの高速化と高機能化</h1>
|
|
79 <h2>琉球大学工学部情報工学科並列信頼研</h2>-->
|
|
80 </div>
|
|
81
|
|
82 </div>
|
|
83
|
|
84 <div class="presentation">
|
|
85
|
|
86 <div class="slide">
|
|
87
|
|
88 <h1>Fine grain Task Manager Cerium のチューニング</h1>
|
|
89 <h3>108574D 金城裕</h3>
|
|
90 <h3>指導教官:河野真治</h3>
|
|
91 <h4>琉球大学大学院理工学研究科情報工学専攻並列信頼研</h4>
|
|
92 </div>
|
|
93
|
|
94
|
|
95 <div class="slide">
|
|
96 <h1>研究目的 と 背景</h1>
|
|
97 <p class="ex1">
|
|
98 現在 Cell/PS3またはMac OS X上で動作するOpen CL 的なFine Grain Task Manager である Cerium Task Manager を開発中である。
|
|
99 </p>
|
|
100 <ul>
|
|
101 <li>
|
|
102 ソフトウェアレンダリングエンジンとWord countを例題として、Task Manager の実装時の問題を洗い出している。
|
|
103 </li>
|
|
104 <br>
|
|
105 <li>メインメモリ上の Task を各 Core が受け取る際や、その終了を通知する際に待ち時間が生じる。</li>
|
|
106 </ul>
|
|
107
|
|
108 <p><font color="red">本研究ではその待ち時間を削減するTask arrayを提案し実装した。その効果について報告する</font></p>
|
|
109
|
|
110 </div>
|
|
111
|
|
112
|
|
113 <div class="slide">
|
|
114 <h1>発表の流れ</h1>
|
|
115
|
|
116 <ul>
|
|
117 <li>Cellとは</li>
|
|
118 <li>Ceriumとは</li>
|
|
119 <li>CeriumにおけるTask</li>
|
|
120 <li>TaskArray</li>
|
|
121 <ul>
|
|
122 <li>WordCountのTaskArray化</li>
|
|
123 <li>レンダリングエンジンのTaskArray化</li>
|
|
124 </ul>
|
|
125 <li>結果</li>
|
|
126 <li>まとめ</li>
|
|
127 </ul>
|
|
128
|
|
129 </div>
|
|
130
|
|
131 <div class="slide">
|
|
132 <h1>Cellとは</h1>
|
|
133
|
|
134 <big>Cell(Cell Broadband Engine)</big>とはソニー、東芝、IBM社の3社が共同開発したマイクロプロセッサ<br>
|
|
135 Cellは1基の制御系のプロセッサコア<u>PPE</u>と、8基の演算系プロセッサコア<u>SPE</u>
|
|
136 で構成される(Ceriumで扱えるSPEの数は6基)。
|
|
137
|
|
138 <!-- PPEよりもSPEが高速なので、1SPE 上で実行するだけでも意味がある。-->
|
|
139 <!-- それぞれ高速なバスで接続されている<br><br> -->
|
|
140
|
|
141 <table height="100%" width="100%" border="0">
|
|
142 <tr><td align="center" valign="middle">
|
|
143 <img src="gazo/cell1.png" style="width: 40%%"></td></tr>
|
|
144 </table>
|
|
145
|
|
146 </div>
|
|
147
|
|
148
|
|
149 <div class="slide">
|
|
150 <h1>Ceriumとは</h1>
|
|
151
|
|
152 <big>Cerium</big>とは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。
|
|
153 以下の3つの要素から構成されている。
|
|
154
|
|
155 <ul>
|
|
156 <li>TaskManager</li>
|
|
157 <li>レンダリングエンジン</li>
|
|
158 <li>SceneGraph</li>
|
|
159 </ul>
|
|
160
|
|
161 </div>
|
|
162
|
|
163 <div class="slide">
|
|
164 <h1>Ceriumとは</h1>
|
|
165
|
|
166 <big>Cerium</big>とは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。
|
|
167 以下の3つの要素から構成されている。
|
|
168
|
|
169 <ul>
|
|
170 <li><font color="red">TaskManager</font></li>
|
|
171 <li>レンダリングエンジン</li>
|
|
172 <li>SceneGraph</li>
|
|
173 </ul>
|
|
174
|
|
175 </div>
|
|
176
|
|
177 <div class="slide">
|
|
178 <h1>TaskManager</h1>
|
|
179
|
|
180 <ul>
|
|
181 <li>TaskManagerは、Taskと呼ばれる、分割された各プログラムを管理する</li>
|
|
182 <ul>
|
12
|
183 <li>Taskの単位はサブルーチン</li>
|
10
|
184 </ul>
|
|
185 <li>Task同士の依存関係を考慮</li>
|
|
186 <li>実行可能になったTaskをSPEに渡す</li>
|
|
187 </ul>
|
|
188
|
|
189 <table height="100%" width="100%" border="0">
|
|
190 <tr><td align="center" valign="middle">
|
12
|
191 <img src="gazo/taskmanager1.png" style="width: 50%%"></td></tr>
|
10
|
192 </table>
|
|
193
|
|
194 </div>
|
|
195
|
|
196 <div class="slide">
|
|
197 <h1>CeriumにおけるTask</h1>
|
|
198
|
|
199 TaskはTaskManagerを使って生成する。Taskを生成する際に以下のような要素が
|
|
200 設定可能である。
|
|
201
|
|
202 <ul>
|
|
203 <li>Input data</li>
|
|
204 <li>Output data</li>
|
|
205 <li>Paramater</li>
|
|
206 <li>CPU type</li>
|
|
207 <li>Dependency</li>
|
|
208 </ul>
|
|
209
|
|
210 </div>
|
|
211
|
|
212 <div class="slide">
|
|
213 <h1>CeriumにおけるTask</h1>
|
|
214 <big><u>Input data</u></big>
|
|
215 <ul>
|
|
216 <li>Input data にはTaskの処理対象データのアドレスとサイズを指定する。</li>
|
|
217 <li>SPE側でそのアドレスをもとにDMA転送を用いて実際のデータをメインメモリから取得する。</li>
|
|
218 </ul>
|
|
219
|
|
220 <table height="100%" width="100%" border="0">
|
|
221 <tr><td align="center" valign="middle">
|
|
222 <img src="gazo/task1.png" style="width: 80%%"></td></tr>
|
|
223 </table>
|
|
224
|
|
225 </div>
|
|
226
|
|
227 <div class="slide">
|
|
228 <h1>CeriumにおけるTask</h1>
|
|
229 <big><u>Output data</u></big>
|
|
230 <ul>
|
|
231 <li>Onput data にはTaskが処理したデータの書き出し先アドレスとサイズを指定する。</li>
|
|
232 <li>SPE側でそのアドレスをもとにDMA転送を用いて実際のデータをメインメモリに書き出す。</li>
|
|
233 </ul>
|
|
234
|
|
235 <table height="100%" width="100%" border="0">
|
|
236 <tr><td align="center" valign="middle">
|
|
237 <img src="gazo/task2.png" style="width: 80%%"></td></tr>
|
|
238 </table>
|
|
239
|
|
240 </div>
|
|
241
|
|
242 <div class="slide">
|
|
243 <h1>CeriumにおけるTask</h1>
|
|
244 <big><u>Paramater</u></big><br>
|
|
245 <ul>
|
|
246 <li>Input data とは別にデータを与えたい場合に使用する。</li>
|
|
247 <li>32bitの値を指定する。</li>
|
|
248 </ul>
|
|
249
|
|
250 <big><u>CPU type</u></big>
|
|
251 <ul>
|
|
252 <li>TaskがどのCoreで実行されるかを指定する。</li>
|
|
253 <li>PPEもしくは、6基のSPEのいづれかを選択できる。</li>
|
|
254 </ul>
|
|
255
|
|
256 </div>
|
|
257
|
|
258 <div class="slide">
|
|
259 <h1>CeriumにおけるTask</h1>
|
|
260 <big><u>Dependency</u></big><br>
|
|
261 <ul>
|
|
262 <li>Dependencyは他のTaskとの依存関係を示す。</li>
|
|
263 <li>例えばTaskAがTaskBの実行完了を待つ例を紹介する。</li>
|
|
264 </ul>
|
|
265
|
|
266 <table height="100%" width="100%" border="0">
|
|
267 <tr><td align="center" valign="middle">
|
|
268 <img src="gazo/dependency1.png" style="width: 40%%"></td></tr>
|
|
269 </table>
|
|
270
|
|
271 </div>
|
|
272
|
|
273
|
|
274 <div class="slide">
|
|
275 <h1>CeriumにおけるTask</h1>
|
|
276 <big><u>Dependency</u></big><br>
|
|
277 <ul>
|
|
278 <li>はじめTaskBは待つTaskがないので、すぐにActiveQueueに入る。</li>
|
|
279 <li>TaskAはTaskBを待つのでWaitQueueに入る。</li>
|
|
280 </ul>
|
|
281
|
|
282 <table height="100%" width="100%" border="0">
|
|
283 <tr><td align="center" valign="middle">
|
|
284 <img src="gazo/dependency2.png" style="width: 60%%"></td></tr>
|
|
285 </table>
|
|
286
|
|
287 </div>
|
|
288
|
|
289 <div class="slide">
|
|
290 <h1>CeriumにおけるTask</h1>
|
|
291 <big><u>Dependency</u></big><br>
|
|
292 <ul>
|
|
293 <li>ActiveQueueにあるTaskBはSPEに送られ実行される。</li>
|
|
294 <li>TaskAはWaitQueueでTaskBを待つ。</li>
|
|
295 </ul>
|
|
296
|
|
297 <table height="100%" width="100%" border="0">
|
|
298 <tr><td align="center" valign="middle">
|
|
299 <img src="gazo/dependency3.png" style="width: 60%%"></td></tr>
|
|
300 </table>
|
|
301
|
|
302 </div>
|
|
303
|
|
304
|
|
305 <div class="slide">
|
|
306 <h1>CeriumにおけるTask</h1>
|
|
307 <big><u>Dependency</u></big><br>
|
|
308 <ul>
|
|
309 <li>TaskBが完了するとMailで通知される。</li>
|
|
310 <li>TaskAは待つTaskがなくなるので、ActiveQueueに移る。</li>
|
|
311 </ul>
|
|
312
|
|
313 <table height="100%" width="100%" border="0">
|
|
314 <tr><td align="center" valign="middle">
|
|
315 <img src="gazo/dependency4.png" style="width: 60%%"></td></tr>
|
|
316 </table>
|
|
317
|
|
318 </div>
|
|
319
|
|
320
|
|
321 <div class="slide">
|
|
322 <h1>CeriumにおけるTask</h1>
|
|
323 <big><u>Dependency</u></big><br>
|
|
324 <ul>
|
|
325 <li>TaskBが完了するとMailで通知される。</li>
|
|
326 <li>TaskAは待つTaskがなくなるので、ActiveQueueに移る。</li>
|
|
327 </ul>
|
|
328
|
|
329 <table height="100%" width="100%" border="0">
|
|
330 <tr><td align="center" valign="middle">
|
|
331 <img src="gazo/dependency5.png" style="width: 60%%"></td></tr>
|
|
332 </table>
|
|
333
|
|
334 </div>
|
|
335
|
|
336
|
|
337 <div class="slide">
|
12
|
338 <h1>Taskの送信</h1>
|
|
339
|
10
|
340 <ul>
|
12
|
341 <li>Taskは1つ毎にSPEには送らない</li>
|
|
342 <li>いくつかのTaskをまとめTaskListとして送る</li>
|
|
343 <li>TaskListをすべて完了すると、SPEからPPEにMail通知が送られる</li>
|
|
344 <li>PPE側がMailをチェックし次のTaskListを通知する</li>
|
10
|
345 </ul>
|
|
346
|
|
347 <table height="100%" width="100%" border="0">
|
|
348 <tr><td align="center" valign="middle">
|
12
|
349 <img src="gazo/tasklist1.png" style="width: 40%%"></td></tr>
|
|
350 </table>
|
|
351
|
|
352 </div>
|
|
353
|
|
354 <div class="slide">
|
|
355 <h1>Mail通知</h1>
|
|
356
|
|
357 <ul>
|
|
358 <li>SPEからPPEへのMail送信ボックスはキューになっている</li>
|
|
359 <li>キューのサイズは1</li>
|
|
360 <li>書き込む際にキューがいっぱいの場合はPPEから呼び出されるまで待つ</li>
|
|
361 <li>PPEからのMail呼び出しがないと、SPEは待ち続ける</li>
|
|
362 </ul>
|
|
363
|
|
364 </div>
|
|
365
|
|
366 <div class="slide">
|
|
367 <h1>TaskArray</h1>
|
|
368
|
|
369 <font color="red">SPEの待ちを解消するためにTaskArrayを提案、実装した</font>
|
|
370
|
|
371 <ul>
|
|
372 <li>TaskArrayは複数のTaskを1つにまとめることができる</li>
|
|
373 <li>Task毎のMail通知がTaskArray毎のMail通知になる</li>
|
|
374 </ul>
|
|
375 <br>
|
|
376 <table height="100%" width="100%" border="0">
|
|
377 <tr><td align="center" valign="middle">
|
|
378 <img src="gazo/taskarray1.png" style="width: 50%%"></td></tr>
|
10
|
379 </table>
|
|
380
|
|
381 </div>
|
|
382
|
|
383 <div class="slide">
|
12
|
384 <h1>TaskArray</h1>
|
10
|
385
|
12
|
386 期待される効果
|
10
|
387
|
12
|
388 <ul>
|
|
389 <li>Mailの数が減り、SPEのMail待ちのタイミングが減る</li>
|
|
390 <li>Mail待ちが減るので、SPEの稼働率が向上する</li>
|
|
391 <li>また、PPE側のMailチェックの時間も減る</li>
|
|
392 <li>結果、処理速度が向上する</li>
|
|
393 </ul>
|
|
394 <br>
|
|
395 <table height="100%" width="100%" border="0">
|
|
396 <tr><td align="center" valign="middle">
|
|
397 <img src="gazo/taskarray1.png" style="width: 50%%"></td></tr>
|
|
398 </table>
|
10
|
399
|
|
400 </div>
|
|
401
|
|
402 <div class="slide">
|
12
|
403 <h1>TaskArray</h1>
|
|
404
|
|
405 <font color="red">WordCountのTaskと、レンダリングエンジンのTaskの一部をTaskArray化した。
|
|
406 その結果を報告する</font><br><br>
|
|
407
|
|
408 それぞれのTask内容
|
|
409
|
|
410 <ul>
|
|
411 <li>WordCount</li>
|
|
412 <ul>
|
|
413 <li>WordCountTask(<font color="red">TaskArray化</font>)</li>
|
|
414 <li>PrintTask</li>
|
|
415 </ul>
|
10
|
416
|
12
|
417 <li>レンダリングエンジン</li>
|
|
418 <ul>
|
|
419 <li>CreatePolygonTask</li>
|
|
420 <li>CreateSpanTask</li>
|
|
421 <li>DrawSpanTask(<font color="red">TaskArray化</font>)</li>
|
|
422 </ul>
|
10
|
423
|
12
|
424 </ul>
|
|
425
|
|
426 </div>
|
|
427
|
|
428 <div class="slide">
|
|
429 <h1>WordCount</h1>
|
10
|
430
|
12
|
431 <ul>
|
|
432 <li>wcするfileをマッピングし、Taskに割り振る</li>
|
|
433 <li>WordCountTaskの終了をまって、PrintTaskが実行される</li>
|
|
434 </ul>
|
|
435
|
|
436 <table height="100%" width="100%" border="0">
|
|
437 <tr><td align="center" valign="middle">
|
|
438 <img src="gazo/wc_graf1.png" style="width: 40%%"></td></tr>
|
|
439 </table>
|
|
440
|
|
441 </div>
|
|
442
|
|
443 <div class="slide">
|
|
444 <h1>WordCount</h1>
|
10
|
445
|
12
|
446 <ul>
|
|
447 <li>TaskArrayのサイズは64</li>
|
|
448 <li>WC対象は166Mのテキスト</li>
|
|
449 <li>TaskArrayの適応の有無を比較</li>
|
|
450 </ul>
|
|
451
|
|
452 </div>
|
10
|
453
|
12
|
454 <div class="slide">
|
|
455 <h1>WordCount</h1>
|
10
|
456
|
12
|
457 <ul>
|
|
458 <li>time : 実行時間</li>
|
|
459 <li>dma wait : dma転送待ちの割合</li>
|
|
460 <li>time wait : mail待ちの割合</li>
|
|
461 </ul>
|
|
462
|
|
463 <br>
|
10
|
464
|
|
465 <table border="3" style="width:100%;">
|
|
466 <tr>
|
|
467 <th></th>
|
12
|
468 <th>Task</th>
|
|
469 <th>TaskArray</th>
|
10
|
470 </tr>
|
|
471 <tr>
|
12
|
472 <th>time</th>
|
|
473 <td align="center">2.184s</td>
|
|
474 <td align="center">2.109s</td>
|
10
|
475
|
|
476 </tr>
|
|
477 <tr>
|
12
|
478 <th>dma wait</th>
|
|
479 <td align="center">18%</td>
|
|
480 <td align="center">12%</td>
|
10
|
481
|
|
482 </tr>
|
|
483 <tr>
|
12
|
484 <th>mail wait</th>
|
|
485 <td align="center">5%</td>
|
|
486 <td align="center">8%</td>
|
10
|
487 </tr>
|
|
488
|
12
|
489 <caption></caption>
|
10
|
490
|
|
491 </table><br>
|
|
492
|
|
493 <div class="slide">
|
12
|
494 <h1>WordCount</h1>
|
10
|
495
|
|
496 <ul>
|
12
|
497 <li>あまり効果は見られなかった</li>
|
|
498 <li>PPE側のTaskがないので、あまりmail待ちが入らない</li>
|
|
499 <li>ファイルのサイズが大きいのでメモリアクセスで時間がかかる</li>
|
10
|
500 </ul>
|
|
501
|
12
|
502 <br>
|
10
|
503
|
|
504 <table border="3" style="width:100%;">
|
|
505 <tr>
|
|
506 <th></th>
|
12
|
507 <th>Task</th>
|
|
508 <th>TaskArray</th>
|
10
|
509 </tr>
|
|
510 <tr>
|
12
|
511 <th>time</th>
|
|
512 <td align="center">2.184s</td>
|
|
513 <td align="center">2.109s</td>
|
10
|
514
|
12
|
515 </tr>
|
|
516 <tr>
|
|
517 <th>dma wait</th>
|
|
518 <td align="center">18%</td>
|
|
519 <td align="center">12%</td>
|
10
|
520
|
|
521 </tr>
|
|
522 <tr>
|
12
|
523 <th>mail wait</th>
|
|
524 <td align="center">5%</td>
|
|
525 <td align="center">8%</td>
|
10
|
526 </tr>
|
|
527
|
12
|
528 <caption></caption>
|
10
|
529
|
|
530 </table><br>
|
|
531
|
12
|
532 </div>
|
|
533
|
|
534 <div class="slide">
|
|
535 <h1>WordCount</h1>
|
|
536
|
|
537 改善策
|
|
538
|
|
539 <ul>
|
|
540 <li>一度にファイルマッピングをしない</li>
|
|
541 <li>何度かに分けてマッピングする</li>
|
|
542 <li>同じ領域を切り替えて使う</li>
|
|
543 <li>スワップを減らし、アクセス時間を短縮する</li>
|
|
544 <li>dma wait の割合が減る</li>
|
|
545 </ul>
|
10
|
546
|
|
547 </div>
|
|
548
|
|
549
|
|
550 <div class="slide">
|
12
|
551 <h1>レンダリングエンジン</h1>
|
10
|
552
|
12
|
553 構成Task
|
10
|
554
|
12
|
555 <ul>
|
|
556 <li>CreatePolygonTask</li>
|
|
557 <li>CreateSpanTask</li>
|
|
558 <li>DrawSpanTask(<font color="red">TaskArray化</font>)</li>
|
|
559 </ul>
|
10
|
560
|
|
561 <br>
|
12
|
562 DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する
|
|
563 例題を対象に計測した。
|
10
|
564
|
|
565 </div>
|
|
566
|
|
567 <div class="slide">
|
12
|
568 <h1>レンダリングエンジン</h1>
|
|
569
|
|
570 <ul>
|
|
571 <li>FPS : 一秒間に表示できるFrame数</li>
|
|
572 </ul>
|
|
573
|
|
574 <table border="3" style="width:100%;">
|
|
575 <tr>
|
|
576 <th></th>
|
|
577 <th>Task</th>
|
|
578 <th>TaskArray</th>
|
|
579 </tr>
|
|
580 <tr>
|
|
581 <th>FPS</th>
|
|
582 <td align="center">3.94</td>
|
|
583 <td align="center">4.32</td>
|
10
|
584
|
12
|
585 </tr>
|
|
586 <tr>
|
|
587 <th>dma wait</th>
|
|
588 <td align="center">0.06%</td>
|
|
589 <td align="center">0.07%</td>
|
10
|
590
|
12
|
591 </tr>
|
|
592 <tr>
|
|
593 <th>mail wait</th>
|
|
594 <td align="center">55%</td>
|
|
595 <td align="center">42%</td>
|
|
596 </tr>
|
|
597
|
|
598 <caption></caption>
|
|
599
|
|
600 </table><br>
|
|
601
|
|
602 <ul>
|
|
603 <li>mail wait 割合が減った</li>
|
|
604 <li>レンダリングエンジンの場合、PPE側で実行するTaskがあるので、
|
|
605 mailチェックが遅れ気味</li>
|
|
606 </ul>
|
10
|
607
|
|
608 </div>
|
|
609
|
|
610 <div class="slide">
|
12
|
611 <h1>まとめ</h1>
|
|
612
|
10
|
613
|
12
|
614 <ul>
|
|
615 <li>複数のTaskをまとめるTaskArrayを提案、実装した。</li>
|
|
616 <li>PPE側が忙しく、mailチェックが遅れる場合に効果的</li>
|
|
617 <li>PPE側にTaskがない場合は、mailチェックは間に合う</li>
|
|
618 <li>WordCountはdma転送がネックになっている</li>
|
|
619 <li>マッピングの方法、Taskのスケジューリングを工夫して、dma転送時間を削減できる</li>
|
|
620
|
|
621
|
|
622 </ul>
|
10
|
623
|
|
624 </div>
|
|
625
|
|
626
|
|
627
|
|
628 <div class="slide">
|
|
629 <h1>end</h1>
|
|
630 <ul>
|
|
631 /*end*/
|
|
632 <br><br>
|
|
633
|
|
634
|
|
635 <div class="handout">
|
|
636 [any material that should appear in print but not on the slide]
|
|
637 </div>
|
|
638 </div>
|
|
639
|
|
640
|
|
641 </div>
|
|
642
|
|
643 </body>
|
|
644 </html>
|