12
|
1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
|
|
2 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
|
|
3
|
|
4 <html xmlns="http://www.w3.org/1999/xhtml">
|
|
5 <META http-equiv="Content-Type" content="text/html; charset=utf-8">
|
|
6
|
|
7 <head>
|
|
8 <title>発表資料</title>
|
|
9 <!-- metadata -->
|
|
10 <meta name="generator" content="S5" />
|
|
11 <meta name="version" content="S5 1.1" />
|
|
12 <meta name="presdate" content="20050728" />
|
|
13 <meta name="author" content="Eric A. Meyer" />
|
|
14 <meta name="company" content="Complex Spiral Consulting" />
|
|
15 <!-- configuration parameters -->
|
|
16 <meta name="defaultView" content="slideshow" />
|
|
17 <meta name="controlVis" content="hidden" />
|
|
18 <!-- style sheet links -->
|
|
19 <link rel="stylesheet" href="ui/default/slides.css" type="text/css" media="projection" id="slideProj" />
|
|
20 <link rel="stylesheet" href="ui/default/outline.css" type="text/css" media="screen" id="outlineStyle" />
|
|
21 <link rel="stylesheet" href="ui/default/print.css" type="text/css" media="print" id="slidePrint" />
|
|
22 <link rel="stylesheet" href="ui/default/opera.css" type="text/css" media="projection" id="operaFix" />
|
|
23 <!-- S5 JS -->
|
|
24 <script src="ui/default/slides.js" type="text/javascript"></script>
|
|
25
|
|
26 <style type="text/css">
|
|
27 body {
|
|
28 font-size: 100%;
|
|
29 }
|
|
30 p.ex10 { font-size: 2.0em; }
|
|
31 p.ex9 { font-size: 1.9em; }
|
|
32 p.ex8 { font-size: 1.8em; }
|
|
33 p.ex7 { font-size: 1.7em; }
|
|
34 p.ex6 { font-size: 1.6em; }
|
|
35 p.ex5 { font-size: 1.5em; }
|
|
36 p.ex4 { font-size: 1.4em; }
|
|
37 p.ex3 { font-size: 1.3em; }
|
|
38 p.ex2 { font-size: 1.2em; }
|
|
39 p.ex1 { font-size: 1.1em; }
|
|
40 p.ex0 { font-size: 1.0em; }
|
|
41 p.ex05 { font-size: 0.5em; }
|
|
42
|
|
43 span.classifier {
|
|
44 font-family: sans-serif ;
|
|
45 font-style: oblique }
|
|
46
|
|
47 span.classifier-delimiter {
|
|
48 font-family: sans-serif ;
|
|
49 font-weight: bold }
|
|
50
|
|
51 span.interpreted {
|
|
52 font-family: sans-serif }
|
|
53
|
|
54 span.option {
|
|
55 white-space: nowrap }
|
|
56
|
|
57 span.pre {
|
|
58 white-space: pre }
|
|
59
|
|
60 span.problematic {
|
|
61 color: red }
|
|
62
|
|
63 span.section-subtitle {
|
|
64 /* font-size relative to parent (h1..h6 element) */
|
|
65 font-size: 80% }
|
|
66
|
|
67 </style>
|
|
68 </head>
|
|
69
|
|
70
|
|
71 <body>
|
|
72
|
|
73 <div class="layout">
|
|
74 <div id="controls"><!-- DO NOT EDIT --></div>
|
|
75 <div id="currentSlide"><!-- DO NOT EDIT --></div>
|
|
76 <div id="header"></div>
|
|
77 <div id="footer">
|
|
78 <!--<h1>Cell上のソフトウェアレンダリングの高速化と高機能化</h1>
|
|
79 <h2>琉球大学工学部情報工学科並列信頼研</h2>-->
|
|
80 </div>
|
|
81
|
|
82 </div>
|
|
83
|
|
84 <div class="presentation">
|
|
85
|
|
86 <div class="slide">
|
|
87
|
|
88 <h1>ゲームフレームワーク Cerium TaskManager の改良</h1>
|
|
89 <h3>金城 裕, 河野 真治, <br>多賀野 海人, 小林 佑亮</h3>
|
|
90 <h4>琉球大学大学院理工学研究科情報工学専攻並列信頼研</h4>
|
|
91 </div>
|
|
92
|
|
93 <div class="slide">
|
|
94 <h1>概要</h1>
|
|
95
|
|
96 ゲームフレームワーク Cerium TaskManager を開発しました。
|
|
97
|
|
98 <ul>
|
|
99 <li>動作環境:MacOSX, Linux, PS3/Cell</li>
|
|
100 <li>主にCellに特化している。</li>
|
|
101 <li>SceneGraphを用いて、ゲームを記述する</li>
|
|
102
|
|
103 </ul><br>
|
|
104
|
|
105 琉球大学の学生実験で使用している。
|
|
106
|
|
107 </div>
|
|
108
|
|
109
|
|
110 <div class="slide">
|
|
111 <h1>Cell</h1>
|
|
112 Cell Broadband Engine
|
|
113
|
|
114 <ul>
|
|
115 <li>ソニー・コンピュータエンタテインメント、ソニー、IBM , 東芝によって開発されたマルチコア CPU である</li>
|
|
116 <li>1基の制御系プロセッサコアPPE(PowerPC Processor Element)</li>
|
|
117 <li>8基の演算系プロセッサコアSPE(Synergistic Processor Element)</li>
|
|
118 <li>各コアはEIB(Element Interconnect Bus)とうバスで接続されている</li>
|
|
119 </ul><br>
|
|
120
|
|
121 </div>
|
|
122
|
|
123 <div class="slide">
|
|
124 <h1>Cell</h1>
|
|
125 Cell Broadband Engine
|
|
126
|
|
127 <table height="100%" width="100%" border="0">
|
|
128 <tr><td align="center" valign="middle">
|
|
129 <img src="gazo/cell_arch.jpg" style="width: 50%%"></td></tr>
|
|
130 </table>
|
|
131
|
|
132
|
|
133 PPEは直接メインメモリアクセスできるが、SPEはそれぞれのLSにしかアクセスできない<br>
|
|
134 DMA転送を用いてメインメモリからのデータを明示的に取得する
|
|
135
|
|
136 </div>
|
|
137
|
|
138 <div class="slide">
|
|
139 <h1>Cell</h1>
|
|
140 Cell のプログラミングスタイル
|
|
141
|
|
142 <ul>
|
|
143 <li>PPEがデータと仕事を分割し、各SPEへ割り当てる</li>
|
|
144 </ul><br>
|
|
145
|
|
146 Ceriumでは関数をTaskとして定義。Taskを各SPEへ割り当てる。<br>
|
|
147 一つのTaskにはinput,output,param,等のデータを持たせる<br>
|
|
148
|
|
149
|
|
150 </div>
|
|
151
|
|
152 <div class="slide">
|
|
153 <h1>Ceriumの構成</h1>
|
|
154
|
|
155 Ceriumの構成
|
|
156
|
|
157 <ul>
|
|
158 <li>TaskManager</li>
|
|
159 <ul>
|
|
160 <li>ユーザが定義したTaskを管理し、各コアに割り当てる</li>
|
|
161 </ul>
|
|
162
|
|
163 <li>RenderingEngine</li>
|
|
164 <ul>
|
|
165 <li>オブジェクトを画面に描画する</li>
|
|
166 <li>3種類のTaskから構成される</li>
|
|
167 </ul>
|
|
168
|
|
169 <li>SceneGraph</li>
|
|
170 <ul>
|
|
171 <li>ゲームのルールを記述してく</li>
|
|
172 <li>ゲームのシーンを作成し、それを切り替えながらゲームを進行する</li>
|
|
173 <li>OpenSceneGraphのようなもの</li>
|
|
174 </ul>
|
|
175
|
|
176 </ul><br>
|
|
177
|
|
178
|
|
179
|
|
180 </div>
|
|
181
|
|
182 <div class="slide">
|
|
183 <h1>Ceriumの構成</h1>
|
|
184
|
|
185 <table height="100%" width="100%" border="0">
|
|
186 <tr><td align="center" valign="middle">
|
|
187 <img src="gazo/cerium.png" style="width: 50%%"></td></tr>
|
|
188 </table>
|
|
189
|
|
190 </div>
|
|
191
|
|
192 <div class="slide">
|
|
193 <h1>TaskManager</h1>
|
|
194
|
|
195 TaskManager
|
|
196
|
|
197 <ul>
|
|
198 <li>Taskは関数単位</li>
|
|
199 <li>定義されたTaskは依存関係に沿って実行される</li>
|
|
200 <li>Taskはある程度の数が揃った上で、TaskListにまとめられSPEに送られる。</li>
|
|
201 <li>Taskはread,exec,write それぞれパイプライン化されて動く</li>
|
|
202 <li>Taskに必要なデータはDMA転送で送られる。転送時間はパイプライン化によって隠される</li>
|
|
203 <li>Taskの中にDMA転送命令を書くと自動ではパイプライン化されない</li>
|
|
204 </ul>
|
|
205
|
|
206 </div>
|
|
207
|
|
208 <div class="slide">
|
|
209 <h1>TaskMangerを使った例題</h1>
|
|
210
|
|
211 CeriumのTaskManager を使ったSortの例題<br>
|
|
212 10万個のランダムな値をクイックソートでソートする<br>
|
|
213 ソートする関数をTaskにして各SPEで実行<br><br>
|
|
214
|
|
215 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
216 <caption>Sortの例題</caption>
|
|
217 <tr>
|
|
218 <th></th>
|
|
219 <th>PPEのみ</th>
|
|
220 <th>SPE 1つ</th>
|
|
221 <th>SPE 6つ</th>
|
|
222 <!--<th>Mac(Core2Duo)</th>-->
|
|
223 <th>SPE稼働率</th>
|
|
224 </tr>
|
|
225 <tr align="center">
|
|
226 <td>QuickSort</td>
|
|
227 <td>5.60s</td>
|
|
228 <td>6.22s</td>
|
|
229 <td>1.07s</td>
|
|
230 <td>97%</td>
|
|
231 <!--<td>1.76s</td>-->
|
|
232 </tr>
|
|
233 </table>
|
|
234
|
|
235 <!-- 2.13GHz -->
|
|
236 </div>
|
|
237
|
|
238
|
|
239 <div class="slide">
|
|
240 <h1>アムダール則</h1>
|
|
241
|
|
242 プログラムの全体に対する並列化した部分の割合が低いと、マルチコアの性能がでない
|
|
243 <!--プログラムの8割を並列化すると、6CPUでは3倍の性能向上しか得られない-->
|
|
244
|
|
245 <table height="100%" width="100%" border="0">
|
|
246 <tr><td align="center" valign="middle">
|
|
247 <img src="gazo/amdahl.jpg" style="width: 55%%"></td></tr>
|
|
248 </table>
|
|
249
|
|
250 </div>
|
|
251
|
|
252 <div class="slide">
|
|
253 <h1>RenderingEngine</h1>
|
|
254
|
|
255 RenderingEngineの例題<br>
|
13
|
256 地球と月の例題
|
12
|
257
|
|
258 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
259 <tr>
|
|
260 <th></th>
|
|
261 <th>FPS</th>
|
13
|
262 <th>mail待ちに割合</th>
|
|
263 <th>SPE稼働率</th>
|
12
|
264 <!--<th>Mac(Core2Duo)</th>-->
|
|
265 </tr>
|
|
266 <tr align="center">
|
|
267 <td>universe</td>
|
|
268 <td>17FPS</td>
|
13
|
269 <td>72.6%</td>
|
12
|
270 <td>25.4%</td>
|
|
271 </tr>
|
|
272 </table>
|
|
273
|
|
274
|
|
275 </div>
|
|
276
|
|
277
|
|
278 <div class="slide">
|
|
279 <h1>RenderingEngine</h1>
|
|
280
|
|
281 SortとRenderingEngineの違い
|
|
282
|
|
283 <ul>
|
|
284 <li>三種類のTaskから構成されている</li>
|
|
285 <li>三つのTaskはバリア同期を行っている</li>
|
|
286 <li>すべてのTaskは一度に作られない</li>
|
|
287 <li>PPEにもTaskが割り振られている</li>
|
|
288 <li>大量のデータを扱う(ポリゴン、テクスチャ)</li>
|
|
289 </ul>
|
|
290
|
|
291 </div>
|
|
292
|
|
293
|
|
294 <div class="slide">
|
|
295 <h1>RenderingEngine</h1>
|
|
296
|
|
297 RenderingEngienの場合の問題点
|
|
298
|
|
299 <ul>
|
|
300 <li>SPEの待ちが入る(SPEの稼働率の低下、処理性能の低下)</li>
|
|
301 <ul>
|
|
302 <li>MailをPPEが読み込みのを待つ</li>
|
|
303 <li>他のSPEを待つ</li>
|
|
304 <li>次のTaskListを待つ</li>
|
|
305 </ul>
|
|
306 <li>Taskはバリア同期している</li>
|
|
307 </ul>
|
|
308
|
|
309 </div>
|
|
310
|
|
311 <div class="slide">
|
|
312 <h1>バリア同期</h1>
|
|
313 <table height="100%" width="100%" border="0">
|
|
314 <tr><td align="center" valign="middle">
|
|
315 <img src="gazo/renderingengine1.png" style="width: 35%%"></td></tr>
|
|
316 </table>
|
|
317
|
|
318 RenderingEngineのTaskは、3つそれぞれバリア同期をしている。
|
|
319
|
|
320 </div>
|
|
321
|
|
322 <div class="slide">
|
|
323 <h1>バリア同期</h1>
|
|
324 バリア同期には二つの待ちがある
|
|
325 <ul>
|
|
326 <li>SPEが他のSPEを待つ時間</li>
|
|
327 <li>バリア同期が完了し、PPE側で次のTaskが作られる時間</li>
|
|
328 </ul><br>
|
|
329
|
|
330
|
|
331 </div>
|
|
332
|
|
333 <div class="slide">
|
|
334 <h1>バリア同期</h1>
|
|
335 <table height="100%" width="100%" border="0">
|
|
336 <tr><td align="center" valign="middle">
|
|
337 <img src="gazo/renderingengine2.png" style="width: 45%%"></td></tr>
|
|
338 </table>
|
|
339
|
|
340 この待ちを解消するためにTaskのパイプライン化を行った。
|
|
341
|
|
342 </div>
|
|
343
|
|
344
|
|
345
|
|
346 <div class="slide">
|
13
|
347 <h1>RenderingEngineの構成</h1>
|
|
348 RenderingEngineの構成
|
|
349 <ul>
|
|
350 <li>CreatePolygon</li>
|
|
351 <ul>
|
|
352 <li>モデリングデータからポリゴンを生成する(PPE)</li>
|
|
353 </ul>
|
|
354 <li>CreateSpan</li>
|
|
355 <ul>
|
|
356 <li>ポリゴンをSpanと呼ばれる水平な線に分ける(SPE)</li>
|
|
357 </ul>
|
|
358 <li>DrawSpan</li>
|
|
359 <ul>
|
|
360 <li>Spanを実際にディスプレイに描画する(SPE)</li>
|
|
361 </ul>
|
|
362 </ul><br>
|
|
363
|
|
364 RenderingEngineは3種類のTaskから構成されている
|
|
365
|
|
366 </div>
|
|
367
|
|
368
|
|
369 <div class="slide">
|
|
370 <h1>パイプライン化</h1>
|
|
371
|
|
372 地球と月を表示する例題(universe)を使用。
|
|
373
|
|
374 <table height="100%" width="100%" border="0">
|
|
375 <tr><td align="center" valign="middle">
|
|
376 <img src="gazo/universe.png" style="width: 45%%"></td></tr>
|
|
377 </table>
|
|
378
|
|
379 </div>
|
|
380
|
|
381 <div class="slide">
|
|
382 <h1>パイプライン化の比較</h1>
|
12
|
383
|
13
|
384 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
385 <caption>パイプライン化の効果(universe)</caption>
|
|
386 <tr>
|
|
387 <th></th>
|
|
388 <th>FPS</th>
|
|
389 <th>mail待ちの割合</th>
|
|
390 <th>稼働率</th>
|
|
391 </tr>
|
|
392 <tr align="center">
|
|
393 <td>Pipelineあり</td>
|
|
394 <td>19.6FPS</td>
|
|
395 <td>68.8%</td>
|
|
396 <td>29%</td>
|
|
397 </tr>
|
|
398 <tr>
|
|
399 <tr align="center">
|
|
400 <td>Pipelineなし</td>
|
|
401 <td>17FPS</td>
|
|
402 <td>72.6%</td>
|
|
403 <td>25.4%</td>
|
|
404 </tr>
|
|
405
|
|
406 </table>
|
|
407 </div>
|
|
408
|
|
409 <div class="slide">
|
|
410 <h1>パイプライン化の比較</h1>
|
|
411
|
|
412 地球と月を表示する例題(universe)を使用。
|
|
413
|
|
414 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
415 <caption>パイプライン化の効果(universe)</caption>
|
|
416 <tr>
|
|
417 <th></th>
|
|
418 <th>FPS</th>
|
|
419 <th>mail待ちの割合</th>
|
|
420 <th>稼働率</th>
|
|
421 </tr>
|
|
422 <tr align="center">
|
|
423 <td>Pipelineあり</td>
|
|
424 <td>19.6FPS</td>
|
|
425 <td>68.8%</td>
|
|
426 <td>29%</td>
|
|
427 </tr>
|
|
428 <tr>
|
|
429 <tr align="center">
|
|
430 <td>Pipelineなし</td>
|
|
431 <td>17FPS</td>
|
|
432 <td>72.6%</td>
|
|
433 <td>25.4%</td>
|
|
434 </tr>
|
|
435
|
|
436 </table>
|
|
437 </div>
|
|
438
|
|
439 <div class="slide">
|
|
440 <h1>RenderingEngine</h1>
|
|
441
|
|
442 RenderingEngineでは、描画するためのテクスチャをSPEに読み込む必要がある<br>
|
|
443
|
|
444 テクスチャをSPE内でのキャッシュした。
|
12
|
445
|
|
446 <ul>
|
13
|
447 <li>DrawSpan内で、描画するためのテクスチャデータを読み込む。</li>
|
|
448 <li>テクスチャは分割さていて、必要な時に必要な部分を読み込む</li>
|
|
449 <li>そこで、テクスチャをキャッシュするようにした(LRU)</li>
|
|
450 <li>テクスチャのデータはハッシュで管理する</li>
|
12
|
451 </ul>
|
|
452
|
13
|
453 </div>
|
|
454
|
|
455
|
|
456
|
|
457 <div class="slide">
|
|
458 <h1>SPEのキャッシュ効果</h1>
|
|
459
|
|
460 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
461 <caption>SPEのキャッシュの効果</caption>
|
|
462 <tr>
|
|
463 <th></th>
|
|
464 <th>キャッシュなし</th>
|
|
465 <th>キャッシュあり</th>
|
|
466 <th>性能</th>
|
|
467 </tr>
|
|
468
|
|
469 <tr align="center">
|
|
470 <td>ball_bound</td>
|
|
471 <td>4FPS</td>
|
|
472 <td>30FPS</td>
|
|
473 <td>7.5倍</td>
|
|
474 </tr>
|
12
|
475
|
13
|
476 <tr align="center">
|
|
477 <td>universe</td>
|
|
478 <td>6FPS</td>
|
|
479 <td>17FPS</td>
|
|
480 <td>2.8倍</td>
|
|
481 </tr>
|
|
482
|
|
483 <tr align="center">
|
|
484 <td>panel</td>
|
|
485 <td>0.2FPS</td>
|
|
486 <td>2.6FPS</td>
|
|
487 <td>13倍</td>
|
|
488 </tr>
|
|
489
|
|
490 </table>
|
|
491
|
|
492 <!--実は改良前の計測にバグが。
|
|
493 キャッシュを無効にした場合にキャッシュヒットはしないが、
|
|
494 キャッシュ処理は行う。つまり余計な処理が入っていた。
|
|
495 -->
|
|
496
|
|
497 <!--テクスチャは頻繁に読み込みが行われるので、キャッシュは有効だった。-->
|
|
498 <!--Span一つに対して、分割されたテクスチャが複数必要。
|
|
499 Spanの数は、1920x1080 の解像度で、最低でも8000ほどのテクスチャ読み込みが起こる。-->
|
12
|
500
|
|
501 </div>
|
|
502
|
13
|
503
|
|
504 <div class="slide">
|
|
505 <h1>SPEのキャッシュ効果</h1>
|
|
506
|
|
507 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
508 <caption>SPEのキャッシュの効果</caption>
|
|
509 <tr>
|
|
510 <th></th>
|
|
511 <th>キャッシュなし</th>
|
|
512 <th>キャッシュあり</th>
|
|
513 <th>性能差</th>
|
|
514 </tr>
|
|
515
|
|
516 <tr align="center">
|
|
517 <td>ball_bound</td>
|
|
518 <td>28FPS</td>
|
|
519 <td>30FPS</td>
|
|
520 <td>+2FPS</td>
|
|
521 </tr>
|
|
522
|
|
523 <tr align="center">
|
|
524 <td>universe</td>
|
|
525 <td>22.9FPS</td>
|
|
526 <td>17FPS</td>
|
|
527 <td>-5.9FPS</td>
|
|
528 </tr>
|
|
529
|
|
530 <tr align="center">
|
|
531 <td>panel</td>
|
|
532 <td>5.0FPS</td>
|
|
533 <td>2.6FPS</td>
|
|
534 <td>-2.4FPS</td>
|
|
535 </tr>
|
|
536
|
|
537 </table>
|
|
538
|
|
539 ball_bound は扱うテクスチャが少なく、小さい
|
|
540
|
|
541 </div>
|
|
542
|
|
543
|
12
|
544 <div class="slide">
|
|
545 <h1>Mailbox機能</h1>
|
|
546 CellのMailbox機能<br>
|
|
547
|
|
548 <ul>
|
|
549 <li>PPEとSPEとの間を双方向で32bitのデータを受け渡す</li>
|
|
550 <li>FIFO キュー構造</li>
|
13
|
551 </ul><br>
|
12
|
552 Mailboxの種類
|
|
553 <ul>
|
|
554 <li>Inbount Mailbox(PPE->SPE 4つ)</li>
|
|
555 <li>Outbount Mailbox(SPE->PPE 一つ)</li>
|
|
556 <li>Outbount interrupt Mailbox(SPE->PPE 一つ)</li>
|
|
557 </ul>
|
|
558
|
|
559 </div>
|
|
560
|
|
561 <div class="slide">
|
|
562 <h1>Mailbox機能</h1>
|
|
563
|
|
564 <table height="100%" width="100%" border="0">
|
|
565 <tr><td align="center" valign="middle">
|
|
566 <img src="gazo/mailbox.png" style="width: 60%%"></td></tr>
|
|
567 </table>
|
|
568
|
|
569 </div>
|
|
570
|
|
571 <div class="slide">
|
|
572 <h1>Mailbox機能</h1>
|
|
573 SPE側からTaskが一つ実行完了する度に、実行完了のMailをOutboxに書きこむ<br>
|
|
574
|
|
575 <ul>
|
|
576 <li>Outboxに既にMailが書きこまれている場合に、PPE側から読み込まれるまで、SPEは待つ(Cellの仕様)</li>
|
|
577 <li>PPE側のMailチェックが追いつかない場合がある。</li>
|
|
578 <li>その間、SPEは何もしないので、処理速度の低下につながる</li>
|
|
579 </ul><br>
|
|
580
|
|
581 そこで、Outboxに既に読み込まれていないMailがあった場合に、いったん、別のキューに追加する。(MailQueue)
|
|
582
|
|
583
|
|
584 </div>
|
|
585
|
|
586 <div class="slide">
|
|
587 <h1>MailQueue</h1>
|
|
588
|
|
589 <ul>
|
|
590 <li>TaskListを消化し、次のTaskListを要求する時に、MailQueueにMailが残っている場合はそれを先に書きだす</li>
|
|
591 <li>PPE側はMailのチェックをMailが無くなるまでループする</li>
|
|
592 <li>PPEはMailがない場合に、自分の仕事に戻る。</li>
|
|
593 <li>今のPPEのMailチェックの仕様には、一度にMailを書きだすのが向いている</li>
|
|
594 </ul>
|
|
595
|
|
596 </ul>
|
|
597
|
|
598 </div>
|
|
599
|
|
600 <div class="slide">
|
|
601 <h1>MailQueueの効果</h1>
|
|
602
|
|
603 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
604 <caption>MailQueueの効果</caption>
|
|
605 <tr>
|
|
606 <th></th>
|
|
607 <th>改良前</th>
|
|
608 <th>改良後</th>
|
|
609 <th>性能</th>
|
|
610 </tr>
|
|
611 <tr align="center">
|
|
612 <td>universe</td>
|
|
613 <td>16FPS</td>
|
|
614 <td>18.5FPS</td>
|
|
615 <td>12%向上</td>
|
|
616 </tr>
|
|
617 </table>
|
|
618
|
|
619 地球と月を表示する例題を使って計測した。
|
|
620
|
|
621 </div>
|
13
|
622 <!--
|
12
|
623 <div class="slide">
|
|
624 <h1>Ceriumの改良点の概要</h1>
|
|
625
|
|
626 Ceriumの改良点の概要
|
|
627
|
|
628 <ul>
|
|
629 <li>TaskManager</li>
|
|
630 <ul>
|
|
631 <li>Taskの同期にはCellのMail機能を使う</li>
|
|
632 <li>Mailの同期するタイミングの改良</li>
|
|
633 <ul>
|
|
634 <li><s>MailQueue</s></li>
|
|
635 <li>TaskArray</li>
|
|
636 </ul>
|
|
637 </ul>
|
|
638
|
|
639 <li>RenderingEngine</li>
|
|
640 <ul>
|
|
641 <li>Taskのパイプライン化</li>
|
|
642 <li>扱う画像をSPE側でキャッシュする</li>
|
|
643 </ul>
|
|
644
|
|
645 </ul>
|
|
646
|
|
647 </div>
|
13
|
648 -->
|
12
|
649
|
|
650 <div class="slide">
|
|
651 <h1>TaskArray</h1>
|
|
652 Task毎のMailは、Task同士の依存関係を解決するために用いている。
|
|
653
|
|
654 <ul>
|
|
655 <li>依存関係はグループ化できる</li>
|
|
656 <li>TaskArrayを用いて複数のTaskのMailを一つに扱う</li>
|
13
|
657 </ul><br>
|
12
|
658
|
|
659 Mailの数を減らせるので、Mailのための処理が減る。その分処理速度が上がる
|
|
660
|
|
661 </div>
|
|
662
|
|
663 <div class="slide">
|
|
664 <h1>TaskArray</h1>
|
|
665
|
|
666 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
667 <caption>TaskArrayの効果(universe)</caption>
|
|
668 <tr>
|
|
669 <th></th>
|
|
670 <th>改良前</th>
|
|
671 <th>改良後</th>
|
|
672 <th>性能</th>
|
|
673 </tr>
|
|
674 <tr align="center">
|
|
675 <td>universe</td>
|
|
676 <td>16FPS</td>
|
|
677 <td>18.5FPS</td>
|
|
678 <td>12%向上</td>
|
|
679 </tr>
|
|
680 </table>
|
|
681
|
|
682 </div>
|
|
683
|
|
684
|
|
685 <div class="slide">
|
|
686 <h1>MailQueueとTaskArray</h1>
|
|
687
|
|
688 <table border="1" cellspacing="0" cellspacing="2" cellpadding="8" align="center">
|
|
689 <caption>MailQueueとTaskArrayの効果(universe)</caption>
|
|
690 <tr>
|
|
691 <th>TaskArray</th>
|
|
692 <th>MailQueue</th>
|
|
693 <th>FPS</th>
|
|
694 <th>性能</th>
|
|
695 </tr>
|
|
696 <tr align="center">
|
|
697 <td>あり</td>
|
|
698 <td>あり</td>
|
|
699 <td>20FPS</td>
|
|
700 <td>22%向上</td>
|
|
701 </tr>
|
|
702 <tr align="center">
|
|
703 <td>あり</td>
|
|
704 <td>なし</td>
|
|
705 <td>18.5FPS</td>
|
|
706 <td>12%向上</td>
|
|
707 </tr>
|
|
708 <tr align="center">
|
|
709 <td>なし</td>
|
|
710 <td>あり</td>
|
|
711 <td>18.5FPS</td>
|
|
712 <td>12%向上</td>
|
|
713 </tr>
|
|
714 <tr align="center">
|
|
715 <td>なし</td>
|
|
716 <td>なし</td>
|
|
717 <td>16.4FPS</td>
|
|
718 <td>0%向上</td>
|
|
719 </tr>
|
|
720 </table>
|
|
721
|
|
722 </div>
|
|
723
|
|
724
|
|
725 <div class="slide">
|
|
726 <h1>OpenGLとの比較</h1>
|
|
727 OpenGL(Open Graphics Library)とは、Silicon Graphics社が開発した、3Dグラフィックス処理の
|
|
728 ためのプログラミングインターフェース。Taskに分割され、SPEを使用したCeriumと、PPEのみで動作
|
13
|
729 するOpenGLとで、処理速度の比較をした。<br><br>
|
|
730
|
|
731 比較する例題には学生が実験中に作成したSuperDandyを用いた。
|
12
|
732 </div>
|
|
733
|
|
734 <div class="slide">
|
|
735 <h1>OpenGLとの比較</h1>
|
|
736
|
|
737 <table border="1" cellspacing="0" cellspacing="2" cellpadding="10" align="center">
|
|
738 <tr>
|
|
739 <th></th>
|
|
740 <th>OpenGL</th>
|
|
741 <th>Cerium</th>
|
|
742 <th>性能差</th>
|
|
743 </tr>
|
|
744 <tr align="center">
|
|
745 <td>dandy</td>
|
|
746 <td>17.5FPS</td>
|
|
747 <td>49.5FPS</td>
|
|
748 <td>2.9倍</td>
|
|
749 </tr>
|
|
750 </table>
|
|
751
|
|
752 コア一つを使用するOpenGLに比べ、Cerium では2.9倍の性能向上が見られた。
|
|
753 SPEを活用、待ち時間の短縮を行い、性能向上がみれた。
|
|
754
|
|
755 </div>
|
|
756
|
|
757 <div class="slide">
|
|
758 <h1>まとめ</h1>
|
|
759
|
|
760 本研究ではゲームフレームワーク Cerium TaskManager の改良を行った。
|
|
761 特にCell上において、SPEの稼働率に注意する必要があった。
|
|
762
|
|
763 SPE、PPE間のデータのやり取りにMail通知を用いている。SPEはMailの書き込みの際に待ちが発生する
|
|
764
|
|
765 <ul>
|
|
766 <li>MailQueue</li>
|
|
767 <li>TaskArray</li>
|
13
|
768 </ul><br>
|
12
|
769
|
|
770 で待ち時間の削減ができる
|
|
771
|
|
772 </div>
|
|
773
|
|
774 <div class="slide">
|
|
775 <h1>まとめ</h1>
|
|
776
|
|
777 RenderingEngineにおいて、Taskがバリア同期をしている。バリア同期にも待ちが発生する
|
|
778
|
|
779 <ul>
|
|
780 <li>Task実行をパイプライン化</li>
|
13
|
781 </ul><br>
|
12
|
782
|
|
783 SPEの待ち時間を解消できる。頻繁に扱うデータはSPE内でキャッシュするのがよい
|
|
784
|
|
785 </div>
|
|
786
|
|
787
|
|
788 <div class="slide">
|
|
789 <h1>依存関係の話</h1>
|
|
790 稼働率を維持するためにパイプライン化がある
|
|
791
|
|
792 <ul>
|
|
793 <li>扱うデータの依存性から、Pipelineを自動で生成できるはず</li>
|
|
794 <li>TaskArrayもデータから自動でできるはず。</li>
|
|
795 <li>データはSegmentとして扱う</li>
|
|
796 </ui>
|
|
797
|
|
798 </div>
|
|
799
|
|
800 <div class="slide">
|
|
801 <h1>Codeload</h1>
|
|
802
|
|
803 Taskを事前に全部ロードしてる
|
|
804
|
|
805 <ul>
|
|
806 <li>SPEのLSは256KB</li>
|
|
807 <li>大量のコードを入れるといっぱいになる</li>
|
|
808 <li>必要な時に必要な分を予測してSPEにロードするのがよい</li>
|
|
809 </ul>
|
|
810
|
|
811 </div>
|
|
812
|
|
813 <div class="slide">
|
|
814 <h1>Segment</h1>
|
|
815
|
|
816 データはすべてSegmentという形にして、SPEに必要な分を予測、読み込みするのがよい。<br>
|
|
817 テクスチャのように頻繁に扱うデータはキャッシュする<br>
|
|
818
|
|
819 </div>
|
|
820
|
|
821
|
|
822
|
|
823 <div class="slide">
|
|
824 <h1>END</h1>
|
|
825
|
|
826 /*end*/
|
|
827
|
|
828 </div>
|
|
829
|
|
830
|
|
831 </ul>
|
|
832
|
|
833 <div class="handout">
|
|
834 [any material that should appear in print but not on the slide]
|
|
835 </div>
|
|
836 </div>
|
|
837
|
|
838
|
|
839 </div>
|
|
840
|
|
841 </body>
|
|
842 </html>
|