10
|
1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
|
|
2 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
|
|
3
|
|
4 <html xmlns="http://www.w3.org/1999/xhtml">
|
|
5 <META http-equiv="Content-Type" content="text/html; charset=utf-8">
|
|
6
|
|
7 <head>
|
|
8 <title>発表資料</title>
|
|
9 <!-- metadata -->
|
|
10 <meta name="generator" content="S5" />
|
|
11 <meta name="version" content="S5 1.1" />
|
|
12 <meta name="presdate" content="20050728" />
|
|
13 <meta name="author" content="Eric A. Meyer" />
|
|
14 <meta name="company" content="Complex Spiral Consulting" />
|
|
15 <!-- configuration parameters -->
|
|
16 <meta name="defaultView" content="slideshow" />
|
|
17 <meta name="controlVis" content="hidden" />
|
|
18 <!-- style sheet links -->
|
|
19 <link rel="stylesheet" href="ui/default/slides.css" type="text/css" media="projection" id="slideProj" />
|
|
20 <link rel="stylesheet" href="ui/default/outline.css" type="text/css" media="screen" id="outlineStyle" />
|
|
21 <link rel="stylesheet" href="ui/default/print.css" type="text/css" media="print" id="slidePrint" />
|
|
22 <link rel="stylesheet" href="ui/default/opera.css" type="text/css" media="projection" id="operaFix" />
|
|
23 <!-- S5 JS -->
|
|
24 <script src="ui/default/slides.js" type="text/javascript"></script>
|
|
25
|
|
26 <style type="text/css">
|
|
27 body {
|
|
28 font-size: 100%;
|
|
29 }
|
|
30 p.ex10 { font-size: 2.0em; }
|
|
31 p.ex9 { font-size: 1.9em; }
|
|
32 p.ex8 { font-size: 1.8em; }
|
|
33 p.ex7 { font-size: 1.7em; }
|
|
34 p.ex6 { font-size: 1.6em; }
|
|
35 p.ex5 { font-size: 1.5em; }
|
|
36 p.ex4 { font-size: 1.4em; }
|
|
37 p.ex3 { font-size: 1.3em; }
|
|
38 p.ex2 { font-size: 1.2em; }
|
|
39 p.ex1 { font-size: 1.1em; }
|
|
40 p.ex0 { font-size: 1.0em; }
|
|
41 p.ex05 { font-size: 0.5em; }
|
|
42
|
|
43 span.classifier {
|
|
44 font-family: sans-serif ;
|
|
45 font-style: oblique }
|
|
46
|
|
47 span.classifier-delimiter {
|
|
48 font-family: sans-serif ;
|
|
49 font-weight: bold }
|
|
50
|
|
51 span.interpreted {
|
|
52 font-family: sans-serif }
|
|
53
|
|
54 span.option {
|
|
55 white-space: nowrap }
|
|
56
|
|
57 span.pre {
|
|
58 white-space: pre }
|
|
59
|
|
60 span.problematic {
|
|
61 color: red }
|
|
62
|
|
63 span.section-subtitle {
|
|
64 /* font-size relative to parent (h1..h6 element) */
|
|
65 font-size: 80% }
|
|
66
|
|
67 </style>
|
|
68 </head>
|
|
69
|
|
70
|
|
71 <body>
|
|
72
|
|
73 <div class="layout">
|
|
74 <div id="controls"><!-- DO NOT EDIT --></div>
|
|
75 <div id="currentSlide"><!-- DO NOT EDIT --></div>
|
|
76 <div id="header"></div>
|
|
77 <div id="footer">
|
|
78 <!--<h1>Cell上のソフトウェアレンダリングの高速化と高機能化</h1>
|
|
79 <h2>琉球大学工学部情報工学科並列信頼研</h2>-->
|
|
80 </div>
|
|
81
|
|
82 </div>
|
|
83
|
|
84 <div class="presentation">
|
|
85
|
|
86 <div class="slide">
|
|
87
|
|
88 <h1>Fine grain Task Manager Cerium のチューニング</h1>
|
14
|
89 <h3>金城裕</h3>
|
10
|
90 <h4>琉球大学大学院理工学研究科情報工学専攻並列信頼研</h4>
|
|
91 </div>
|
|
92
|
|
93
|
|
94 <div class="slide">
|
|
95 <h1>研究目的 と 背景</h1>
|
|
96 <p class="ex1">
|
|
97 現在 Cell/PS3またはMac OS X上で動作するOpen CL 的なFine Grain Task Manager である Cerium Task Manager を開発中である。
|
|
98 </p>
|
|
99 <ul>
|
|
100 <li>
|
|
101 ソフトウェアレンダリングエンジンとWord countを例題として、Task Manager の実装時の問題を洗い出している。
|
|
102 </li>
|
|
103 <br>
|
|
104 <li>メインメモリ上の Task を各 Core が受け取る際や、その終了を通知する際に待ち時間が生じる。</li>
|
|
105 </ul>
|
|
106
|
|
107 <p><font color="red">本研究ではその待ち時間を削減するTask arrayを提案し実装した。その効果について報告する</font></p>
|
|
108
|
|
109 </div>
|
|
110
|
|
111
|
|
112 <div class="slide">
|
|
113 <h1>発表の流れ</h1>
|
|
114
|
|
115 <ul>
|
|
116 <li>Cellとは</li>
|
|
117 <li>Ceriumとは</li>
|
|
118 <li>CeriumにおけるTask</li>
|
|
119 <li>TaskArray</li>
|
|
120 <ul>
|
|
121 <li>WordCountのTaskArray化</li>
|
|
122 <li>レンダリングエンジンのTaskArray化</li>
|
|
123 </ul>
|
|
124 <li>結果</li>
|
|
125 <li>まとめ</li>
|
|
126 </ul>
|
|
127
|
|
128 </div>
|
|
129
|
|
130 <div class="slide">
|
|
131 <h1>Cellとは</h1>
|
|
132
|
|
133 <big>Cell(Cell Broadband Engine)</big>とはソニー、東芝、IBM社の3社が共同開発したマイクロプロセッサ<br>
|
|
134 Cellは1基の制御系のプロセッサコア<u>PPE</u>と、8基の演算系プロセッサコア<u>SPE</u>
|
|
135 で構成される(Ceriumで扱えるSPEの数は6基)。
|
|
136
|
|
137 <!-- PPEよりもSPEが高速なので、1SPE 上で実行するだけでも意味がある。-->
|
|
138 <!-- それぞれ高速なバスで接続されている<br><br> -->
|
|
139
|
|
140 <table height="100%" width="100%" border="0">
|
|
141 <tr><td align="center" valign="middle">
|
|
142 <img src="gazo/cell1.png" style="width: 40%%"></td></tr>
|
|
143 </table>
|
|
144
|
|
145 </div>
|
|
146
|
|
147
|
|
148 <div class="slide">
|
|
149 <h1>Ceriumとは</h1>
|
|
150
|
|
151 <big>Cerium</big>とは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。
|
|
152 以下の3つの要素から構成されている。
|
|
153
|
|
154 <ul>
|
|
155 <li>TaskManager</li>
|
|
156 <li>レンダリングエンジン</li>
|
|
157 <li>SceneGraph</li>
|
|
158 </ul>
|
|
159
|
|
160 </div>
|
|
161
|
|
162 <div class="slide">
|
|
163 <h1>Ceriumとは</h1>
|
|
164
|
|
165 <big>Cerium</big>とは、当研究室で開発したPS3/Cell、Mac OS X、Linux 上で動作するゲームフレームワーク。
|
|
166 以下の3つの要素から構成されている。
|
|
167
|
|
168 <ul>
|
|
169 <li><font color="red">TaskManager</font></li>
|
|
170 <li>レンダリングエンジン</li>
|
|
171 <li>SceneGraph</li>
|
|
172 </ul>
|
|
173
|
|
174 </div>
|
|
175
|
|
176 <div class="slide">
|
|
177 <h1>TaskManager</h1>
|
|
178
|
|
179 <ul>
|
|
180 <li>TaskManagerは、Taskと呼ばれる、分割された各プログラムを管理する</li>
|
|
181 <ul>
|
12
|
182 <li>Taskの単位はサブルーチン</li>
|
10
|
183 </ul>
|
|
184 <li>Task同士の依存関係を考慮</li>
|
|
185 <li>実行可能になったTaskをSPEに渡す</li>
|
|
186 </ul>
|
|
187
|
|
188 <table height="100%" width="100%" border="0">
|
|
189 <tr><td align="center" valign="middle">
|
12
|
190 <img src="gazo/taskmanager1.png" style="width: 50%%"></td></tr>
|
10
|
191 </table>
|
|
192
|
|
193 </div>
|
|
194
|
|
195 <div class="slide">
|
|
196 <h1>CeriumにおけるTask</h1>
|
|
197
|
|
198 TaskはTaskManagerを使って生成する。Taskを生成する際に以下のような要素が
|
|
199 設定可能である。
|
|
200
|
|
201 <ul>
|
|
202 <li>Input data</li>
|
|
203 <li>Output data</li>
|
|
204 <li>Paramater</li>
|
|
205 <li>CPU type</li>
|
|
206 <li>Dependency</li>
|
|
207 </ul>
|
|
208
|
|
209 </div>
|
|
210
|
14
|
211 <!-- <div class="slide"> -->
|
|
212 <!-- <h1>CeriumにおけるTask</h1> -->
|
|
213 <!-- <big><u>Input data</u></big> -->
|
|
214 <!-- <ul> -->
|
|
215 <!-- <li>Input data にはTaskの処理対象データのアドレスとサイズを指定する。</li> -->
|
|
216 <!-- <li>SPE側でそのアドレスをもとにDMA転送を用いて実際のデータをメインメモリから取得する。</li> -->
|
|
217 <!-- </ul> -->
|
10
|
218
|
14
|
219 <!-- <big><u>Output data</u></big> -->
|
|
220 <!-- <ul> -->
|
|
221 <!-- <li>Onput data にはTaskが処理したデータの書き出し先アドレスとサイズを指定する。</li> -->
|
|
222 <!-- <li>SPE側でそのアドレスをもとにDMA転送を用いて実際のデータをメインメモリに書き出す。</li> -->
|
|
223 <!-- </ul> -->
|
10
|
224
|
14
|
225 <!-- </div> -->
|
10
|
226
|
14
|
227 <!-- <div class="slide"> -->
|
|
228 <!-- <h1>CeriumにおけるTask</h1> -->
|
|
229 <!-- <big><u>Paramater</u></big><br> -->
|
|
230 <!-- <ul> -->
|
|
231 <!-- <li>Input data とは別にデータを与えたい場合に使用する。</li> -->
|
|
232 <!-- <li>32bitの値を指定する。</li> -->
|
|
233 <!-- </ul> -->
|
10
|
234
|
14
|
235 <!-- <big><u>CPU type</u></big> -->
|
|
236 <!-- <ul> -->
|
|
237 <!-- <li>TaskがどのCoreで実行されるかを指定する。</li> -->
|
|
238 <!-- <li>PPEもしくは、6基のSPEのいづれかを選択できる。</li> -->
|
|
239 <!-- </ul> -->
|
10
|
240
|
14
|
241 <!-- </div> -->
|
10
|
242
|
|
243 <div class="slide">
|
|
244 <h1>CeriumにおけるTask</h1>
|
|
245 <big><u>Dependency</u></big><br>
|
|
246 <ul>
|
|
247 <li>Dependencyは他のTaskとの依存関係を示す。</li>
|
14
|
248 <li>例えばTaskAがTaskBをwaitする場合、TaskBが実行完了すると、TaskAが実行可能になる。</li>
|
|
249 <li>Taskの実行完了は、SPEのMail送信ボックスにデータが書き込まれ通知される。</li>
|
10
|
250 </ul>
|
|
251
|
|
252 <table height="100%" width="100%" border="0">
|
|
253 <tr><td align="center" valign="middle">
|
|
254 <img src="gazo/dependency1.png" style="width: 40%%"></td></tr>
|
|
255 </table>
|
|
256
|
|
257 </div>
|
|
258
|
|
259
|
|
260 <div class="slide">
|
|
261 <h1>CeriumにおけるTask</h1>
|
14
|
262 <big><u>Mail機能</u></big><br>
|
10
|
263 <ul>
|
14
|
264 <li>Cellの機能の1つ</li>
|
|
265 <li>32bitのメッセージをPPE,SPE間でやりとりできる</li>
|
|
266 <li>送信ボックス、受信ボックスがSPEに設けられている。</li>
|
|
267 <li>それぞれMailボックスはキューになっている</li>
|
|
268 <li>受信ボックスのサイズは4</li>
|
|
269 <li>送信ボックスのサイズは1</li>
|
10
|
270 </ul>
|
|
271
|
|
272 </div>
|
|
273
|
|
274 <div class="slide">
|
|
275 <h1>CeriumにおけるTask</h1>
|
14
|
276 <big><u>Mail機能</u></big><br>
|
10
|
277 <ul>
|
14
|
278 <li>送信ボックスのデータはPPEから、受信ボックスのデータはSPEから呼び出される</li>
|
|
279 <li>書き込みはその逆</li>
|
10
|
280 </ul>
|
|
281
|
|
282 <table height="100%" width="100%" border="0">
|
|
283 <tr><td align="center" valign="middle">
|
14
|
284 <img src="gazo/mail.png" style="width: 60%%"></td></tr>
|
10
|
285 </table>
|
|
286
|
|
287 </div>
|
|
288
|
|
289
|
|
290 <div class="slide">
|
12
|
291 <h1>Taskの送信</h1>
|
|
292
|
10
|
293 <ul>
|
12
|
294 <li>Taskは1つ毎にSPEには送らない</li>
|
|
295 <li>いくつかのTaskをまとめTaskListとして送る</li>
|
14
|
296 <li>TaskListをすべて完了すると、SPEからPPEへのMailが書き込まれる</li>
|
|
297 <li>PPE側がMailをチェックし次のTaskListをMailで通知する</li>
|
10
|
298 </ul>
|
|
299
|
|
300 <table height="100%" width="100%" border="0">
|
|
301 <tr><td align="center" valign="middle">
|
12
|
302 <img src="gazo/tasklist1.png" style="width: 40%%"></td></tr>
|
|
303 </table>
|
|
304
|
|
305 </div>
|
|
306
|
|
307 <div class="slide">
|
14
|
308 <h1>SPEの待ち時間</h1>
|
|
309
|
|
310 SPEはデータの転送とMailの読み込み、書き込みの際に待ち時間が生じることがある。
|
|
311
|
12
|
312
|
|
313 <ul>
|
14
|
314
|
|
315 <li>
|
|
316 送信Mailボックスに書き込もうとしたとき、
|
|
317 ボックスがいっぱいの場合は、PPEから呼び出されるまでSPEは待ち続ける
|
|
318 </li>
|
|
319
|
|
320 <li>
|
|
321 TaskManagerでは、受信ボックスがいっぱいになることはない。
|
|
322 </li>
|
|
323
|
|
324 <li>PPEでMailのチェック、返信があるまで、SPEは止まってしまう</li>
|
13
|
325 <li>SPEの待ち時間が増えると、処理速度の低下につながる</li>
|
14
|
326
|
12
|
327 </ul>
|
|
328
|
|
329 </div>
|
|
330
|
|
331 <div class="slide">
|
|
332 <h1>TaskArray</h1>
|
|
333
|
14
|
334 <font color="red">SPEのMailの待ち時間を解消するためにTaskArrayを提案、実装した</font>
|
12
|
335
|
|
336 <ul>
|
|
337 <li>TaskArrayは複数のTaskを1つにまとめることができる</li>
|
|
338 <li>Task毎のMail通知がTaskArray毎のMail通知になる</li>
|
14
|
339 <li>依存関係のグルーピングができる</li>
|
12
|
340 </ul>
|
|
341 <br>
|
|
342 <table height="100%" width="100%" border="0">
|
|
343 <tr><td align="center" valign="middle">
|
|
344 <img src="gazo/taskarray1.png" style="width: 50%%"></td></tr>
|
10
|
345 </table>
|
|
346
|
|
347 </div>
|
|
348
|
|
349 <div class="slide">
|
12
|
350 <h1>TaskArray</h1>
|
10
|
351
|
12
|
352 期待される効果
|
10
|
353
|
12
|
354 <ul>
|
|
355 <li>Mailの数が減り、SPEのMail待ちのタイミングが減る</li>
|
|
356 <li>Mail待ちが減るので、SPEの稼働率が向上する</li>
|
|
357 <li>また、PPE側のMailチェックの時間も減る</li>
|
|
358 <li>結果、処理速度が向上する</li>
|
|
359 </ul>
|
|
360 <br>
|
|
361 <table height="100%" width="100%" border="0">
|
|
362 <tr><td align="center" valign="middle">
|
|
363 <img src="gazo/taskarray1.png" style="width: 50%%"></td></tr>
|
|
364 </table>
|
10
|
365
|
|
366 </div>
|
|
367
|
|
368 <div class="slide">
|
12
|
369 <h1>TaskArray</h1>
|
|
370
|
14
|
371 <font color="red">レンダリングエンジンのTaskと、WordCountのTaskの一部をTaskArray化した。
|
12
|
372 その結果を報告する</font><br><br>
|
|
373
|
14
|
374 レンダリングエンジンのTask内容
|
|
375
|
|
376 <ul>
|
|
377 <li>CreatePolygonTask</li>
|
|
378 <ul>
|
|
379 <li>Polygonを生成する</li>
|
|
380 </ul>
|
|
381 <li>CreateSpanTask</li>
|
|
382 <ul>
|
|
383 <li>Polygonを水平な線(Span)に分割する</li>
|
|
384 </ul>
|
|
385 <li>DrawSpanTask(<font color="red">TaskArray化</font>)</li>
|
|
386 <ul>
|
|
387 <li>Spanを描画する</li>
|
|
388 </ul>
|
|
389 </ul>
|
|
390
|
|
391
|
|
392 </div>
|
|
393
|
|
394 <div class="slide">
|
|
395 <h1>レンダリングエンジン</h1>
|
|
396
|
|
397 DrawSpanTask : Taskの数が多いDrawSpanTaskをTaskArray化した。地球と月を表示する
|
|
398 例題を対象に計測した。<br><br>
|
|
399
|
|
400 計測条件
|
12
|
401
|
|
402 <ul>
|
14
|
403 <li>FPS : 一秒間に表示するFrame数</li>
|
|
404 <li>dma wait : dma転送の待ち時間の割合</li>
|
|
405 <li>mail wait : mailの待ち時間の割合</li>
|
|
406 <li>TaskArrayの適応の有無を比較</li>
|
|
407 <li>TaskArrayのサイズは8</li>
|
10
|
408
|
12
|
409 </ul>
|
|
410
|
|
411 </div>
|
|
412
|
|
413 <div class="slide">
|
14
|
414 <h1>レンダリングエンジン</h1>
|
|
415
|
|
416 <table border="3" style="width:100%;">
|
|
417 <tr>
|
|
418 <th></th>
|
|
419 <th>Task</th>
|
|
420 <th>TaskArray</th>
|
|
421 </tr>
|
|
422 <tr>
|
|
423 <th>FPS</th>
|
|
424 <td align="center">3.94</td>
|
|
425 <td align="center">4.32</td>
|
|
426
|
|
427 </tr>
|
|
428 <tr>
|
|
429 <th>dma wait</th>
|
|
430 <td align="center">0.06%</td>
|
|
431 <td align="center">0.07%</td>
|
|
432
|
|
433 </tr>
|
|
434 <tr>
|
|
435 <th>mail wait</th>
|
|
436 <td align="center">55%</td>
|
|
437 <td align="center">42%(<font color="red">-13%</font>)</td>
|
|
438 </tr>
|
10
|
439
|
14
|
440 <caption>レンダリングエンジンの比較</caption>
|
|
441
|
|
442 </table><br>
|
|
443
|
|
444 <ul>
|
|
445 <li>mail wait 割合が減少し、それに伴ってFPSも増加</li>
|
|
446 <li>レンダリングエンジンの場合、PPE側で実行するTaskがある</li>
|
|
447 <li>PPEのMailチェックがおくれることがあるので、Mailを減らすことは効果がある</li>
|
|
448 </ul>
|
|
449
|
|
450 </div>
|
13
|
451
|
14
|
452 <div class="slide">
|
|
453 <h1>レンダリングエンジン</h1>
|
|
454
|
|
455 今後のMail待ち時間削減の改善点
|
|
456
|
|
457 <ul>
|
|
458 <li>PPE側のTaskをSPEに任せ、PPEの負担をへらす</li>
|
|
459 <li>別スレッドでMailを監視する</li>
|
|
460 <li>他のTaskもTaskArray化する</li>
|
|
461 </ul>
|
|
462
|
|
463 </div>
|
|
464
|
|
465 <div class="slide">
|
15
|
466
|
|
467 WordCountのTask内容
|
|
468
|
13
|
469 <ul>
|
|
470 <li>WordCountTask(<font color="red">TaskArray化</font>)</li>
|
|
471 <ul>
|
|
472 <li>Input data であたえられたデータをwcし、output data に書き出す</li>
|
|
473 </ul>
|
|
474
|
|
475 <li>PrintTask</li>
|
|
476 <ul>
|
|
477 <li>各SPEから書き出されたwcデータを集計し、出力する</li>
|
|
478 <li>dependency に WordCountTaskを設定</li>
|
|
479 </ul>
|
|
480
|
|
481 </ul>
|
|
482
|
14
|
483 </ul>
|
13
|
484 </div>
|
|
485
|
|
486 <div class="slide">
|
|
487 <h1>WordCount</h1>
|
|
488
|
12
|
489 <ul>
|
|
490 <li>wcするfileをマッピングし、Taskに割り振る</li>
|
|
491 <li>WordCountTaskの終了をまって、PrintTaskが実行される</li>
|
|
492 </ul>
|
|
493
|
|
494 <table height="100%" width="100%" border="0">
|
|
495 <tr><td align="center" valign="middle">
|
|
496 <img src="gazo/wc_graf1.png" style="width: 40%%"></td></tr>
|
|
497 </table>
|
|
498
|
|
499 </div>
|
|
500
|
|
501 <div class="slide">
|
|
502 <h1>WordCount</h1>
|
10
|
503
|
13
|
504 計測条件
|
|
505
|
12
|
506 <ul>
|
|
507 <li>TaskArrayのサイズは64</li>
|
13
|
508 <li>Word count対象は166Mのテキスト</li>
|
12
|
509 <li>TaskArrayの適応の有無を比較</li>
|
|
510 </ul>
|
|
511
|
|
512 </div>
|
10
|
513
|
15
|
514
|
|
515
|
12
|
516 <div class="slide">
|
|
517 <h1>WordCount</h1>
|
10
|
518
|
15
|
519 time : 実行時間
|
10
|
520 <table border="3" style="width:100%;">
|
|
521 <tr>
|
|
522 <th></th>
|
12
|
523 <th>Task</th>
|
|
524 <th>TaskArray</th>
|
10
|
525 </tr>
|
|
526 <tr>
|
12
|
527 <th>time</th>
|
15
|
528 <td align="center">2.102s</td>
|
|
529 <td align="center">2.083s</td>
|
10
|
530
|
|
531 </tr>
|
|
532 <tr>
|
12
|
533 <th>dma wait</th>
|
|
534 <td align="center">12%</td>
|
15
|
535 <td align="center">17(+5)%</td>
|
10
|
536
|
|
537 </tr>
|
|
538 <tr>
|
12
|
539 <th>mail wait</th>
|
15
|
540 <td align="center">7%</td>
|
|
541 <td align="center">2(-5)%</td>
|
10
|
542 </tr>
|
|
543
|
15
|
544 <caption>WordCountの比較</caption>
|
10
|
545
|
|
546 </table><br>
|
|
547
|
15
|
548 Mail wait の割合が減少、代わりに dma wait が増加
|
|
549
|
|
550 </div>
|
|
551
|
10
|
552 <div class="slide">
|
12
|
553 <h1>WordCount</h1>
|
10
|
554
|
|
555 <ul>
|
15
|
556 <li>PPEで実行するTaskがないため、Mailをチェックしやすい</li>
|
|
557 <li>dma wait が</li>
|
|
558 <li></li>
|
10
|
559 </ul>
|
|
560
|
12
|
561 </div>
|
|
562
|
|
563 <div class="slide">
|
|
564 <h1>WordCount</h1>
|
|
565
|
|
566 改善策
|
|
567
|
|
568 <ul>
|
15
|
569 <li></li>
|
13
|
570 <li>同じ領域を切り替えて、何度かに分けてマッピングする</li>
|
|
571 <li>スワップを減らし、アクセス時間を短縮できる</li>
|
12
|
572 <li>dma wait の割合が減る</li>
|
|
573 </ul>
|
10
|
574
|
|
575 </div>
|
|
576
|
|
577 <div class="slide">
|
12
|
578 <h1>まとめ</h1>
|
|
579
|
10
|
580
|
12
|
581 <ul>
|
|
582 <li>複数のTaskをまとめるTaskArrayを提案、実装した。</li>
|
13
|
583 <li>PPE側が忙しく、mailチェックが遅れる場合に効果がある</li>
|
12
|
584 <li>PPE側にTaskがない場合は、mailチェックは間に合う</li>
|
|
585 <li>WordCountはdma転送がネックになっている</li>
|
|
586 <li>マッピングの方法、Taskのスケジューリングを工夫して、dma転送時間を削減できる</li>
|
|
587
|
|
588
|
|
589 </ul>
|
10
|
590
|
|
591 </div>
|
|
592
|
|
593
|
|
594
|
|
595 <div class="slide">
|
|
596 <h1>end</h1>
|
|
597 <ul>
|
|
598 /*end*/
|
|
599 <br><br>
|
|
600
|
|
601
|
|
602 <div class="handout">
|
|
603 [any material that should appear in print but not on the slide]
|
|
604 </div>
|
|
605 </div>
|
|
606
|
|
607
|
|
608 </div>
|
|
609
|
|
610 </body>
|
|
611 </html>
|