view presen/presen.html @ 26:252d2d951d7e

add Task Manager
author gongo@gendarme.cr.ie.u-ryukyu.ac.jp
date Sun, 15 Feb 2009 11:44:57 +0900
parents de8ba175cc9b
children 90128e098120
line wrap: on
line source

<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<meta name="generator" content="Docutils 0.4: http://docutils.sourceforge.net/" />
<meta name="version" content="S5 1.1" />
<title>Cell 用の Fine-Grain Task Manager の実装</title>
<style type="text/css">

/*
:Author: David Goodger
:Contact: goodger@users.sourceforge.net
:Date: $Date: 2005-12-18 01:56:14 +0100 (Sun, 18 Dec 2005) $
:Revision: $Revision: 4224 $
:Copyright: This stylesheet has been placed in the public domain.

Default cascading style sheet for the HTML output of Docutils.

See http://docutils.sf.net/docs/howto/html-stylesheets.html for how to
customize this style sheet.
*/

/* used to remove borders from tables and images */
.borderless, table.borderless td, table.borderless th {
  border: 0 }

table.borderless td, table.borderless th {
  /* Override padding for "table.docutils td" with "! important".
     The right padding separates the table cells. */
  padding: 0 0.5em 0 0 ! important }

.first {
  /* Override more specific margin styles with "! important". */
  margin-top: 0 ! important }

.last, .with-subtitle {
  margin-bottom: 0 ! important }

.hidden {
  display: none }

a.toc-backref {
  text-decoration: none ;
  color: black }

blockquote.epigraph {
  margin: 2em 5em ; }

dl.docutils dd {
  margin-bottom: 0.5em }

/* Uncomment (and remove this text!) to get bold-faced definition list terms
dl.docutils dt {
  font-weight: bold }
*/

div.abstract {
  margin: 2em 5em }

div.abstract p.topic-title {
  font-weight: bold ;
  text-align: center }

div.admonition, div.attention, div.caution, div.danger, div.error,
div.hint, div.important, div.note, div.tip, div.warning {
  margin: 2em ;
  border: medium outset ;
  padding: 1em }

div.admonition p.admonition-title, div.hint p.admonition-title,
div.important p.admonition-title, div.note p.admonition-title,
div.tip p.admonition-title {
  font-weight: bold ;
  font-family: sans-serif }

div.attention p.admonition-title, div.caution p.admonition-title,
div.danger p.admonition-title, div.error p.admonition-title,
div.warning p.admonition-title {
  color: red ;
  font-weight: bold ;
  font-family: sans-serif }

/* Uncomment (and remove this text!) to get reduced vertical space in
   compound paragraphs.
div.compound .compound-first, div.compound .compound-middle {
  margin-bottom: 0.5em }

div.compound .compound-last, div.compound .compound-middle {
  margin-top: 0.5em }
*/

div.dedication {
  margin: 2em 5em ;
  text-align: center ;
  font-style: italic }

div.dedication p.topic-title {
  font-weight: bold ;
  font-style: normal }

div.figure {
  margin-left: 2em ;
  margin-right: 2em }

div.footer, div.header {
  clear: both;
  font-size: smaller }

div.line-block {
  display: block ;
  margin-top: 1em ;
  margin-bottom: 1em }

div.line-block div.line-block {
  margin-top: 0 ;
  margin-bottom: 0 ;
  margin-left: 1.5em }

div.sidebar {
  margin-left: 1em ;
  border: medium outset ;
  padding: 1em ;
  background-color: #ffffee ;
  width: 40% ;
  float: right ;
  clear: right }

div.sidebar p.rubric {
  font-family: sans-serif ;
  font-size: medium }

div.system-messages {
  margin: 5em }

div.system-messages h1 {
  color: red }

div.system-message {
  border: medium outset ;
  padding: 1em }

div.system-message p.system-message-title {
  color: red ;
  font-weight: bold }

div.topic {
  margin: 2em }

h1.section-subtitle, h2.section-subtitle, h3.section-subtitle,
h4.section-subtitle, h5.section-subtitle, h6.section-subtitle {
  margin-top: 0.4em }

h1.title {
  text-align: center }

h2.subtitle {
  text-align: center }

hr.docutils {
  width: 75% }

img.align-left {
  clear: left }

img.align-right {
  clear: right }

ol.simple, ul.simple {
  margin-bottom: 1em }

ol.arabic {
  list-style: decimal }

ol.loweralpha {
  list-style: lower-alpha }

ol.upperalpha {
  list-style: upper-alpha }

ol.lowerroman {
  list-style: lower-roman }

ol.upperroman {
  list-style: upper-roman }

p.attribution {
  text-align: right ;
  margin-left: 50% }

p.caption {
  font-style: italic }

p.credits {
  font-style: italic ;
  font-size: smaller }

p.label {
  white-space: nowrap }

p.rubric {
  font-weight: bold ;
  font-size: larger ;
  color: maroon ;
  text-align: center }

p.sidebar-title {
  font-family: sans-serif ;
  font-weight: bold ;
  font-size: larger }

p.sidebar-subtitle {
  font-family: sans-serif ;
  font-weight: bold }

p.topic-title {
  font-weight: bold }

pre.address {
  margin-bottom: 0 ;
  margin-top: 0 ;
  font-family: serif ;
  font-size: 100% }

pre.literal-block, pre.doctest-block {
  margin-left: 2em ;
  margin-right: 2em ;
  background-color: #eeeeee }

span.classifier {
  font-family: sans-serif ;
  font-style: oblique }

span.classifier-delimiter {
  font-family: sans-serif ;
  font-weight: bold }

span.interpreted {
  font-family: sans-serif }

span.option {
  white-space: nowrap }

span.pre {
  white-space: pre }

span.problematic {
  color: red }

span.section-subtitle {
  /* font-size relative to parent (h1..h6 element) */
  font-size: 80% }

table.citation {
  border-left: solid 1px gray;
  margin-left: 1px }

table.docinfo {
  margin: 2em 4em }

table.docutils {
  margin-top: 0.5em ;
  margin-bottom: 0.5em }

table.footnote {
  border-left: solid 1px black;
  margin-left: 1px }

table.docutils td, table.docutils th,
table.docinfo td, table.docinfo th {
  padding-left: 0.5em ;
  padding-right: 0.5em ;
  vertical-align: top }

table.docutils th.field-name, table.docinfo th.docinfo-name {
  font-weight: bold ;
  text-align: left ;
  white-space: nowrap ;
  padding-left: 0 }

h1 tt.docutils, h2 tt.docutils, h3 tt.docutils,
h4 tt.docutils, h5 tt.docutils, h6 tt.docutils {
  font-size: 100% }

tt.docutils {
  background-color: #eeeeee }

ul.auto-toc {
  list-style-type: none }

</style>
<!-- configuration parameters -->
<meta name="defaultView" content="slideshow" />
<meta name="controlVis" content="hidden" />
<!-- style sheet links -->
<script src="ui/default/slides.js" type="text/javascript"></script>
<link rel="stylesheet" href="ui/default/slides.css"
      type="text/css" media="projection" id="slideProj" />
<link rel="stylesheet" href="ui/default/outline.css"
      type="text/css" media="screen" id="outlineStyle" />
<link rel="stylesheet" href="ui/default/print.css"
      type="text/css" media="print" id="slidePrint" />
<link rel="stylesheet" href="ui/default/opera.css"
      type="text/css" media="projection" id="operaFix" />

<style type="text/css">
#currentSlide {display: none;}
</style>
</head>
<body>
<div class="layout">
<div id="controls"></div>
<div id="currentSlide"></div>
<div id="header">

</div>
<div id="footer">
<h1>Cell 用の Fine-Grain Task Manager の実装</h1>

</div>
</div>
<div class="presentation">
<div class="slide" id="slide0">
<h1 class="title">Cell 用の Fine-Grain Task Manager の実装</h1>
<!-- Definitions of interpreted text roles (classes) for S5/HTML data. -->
<!-- This data file has been placed in the public domain. -->
<!-- Colours
======= -->
<!-- Text Sizes
========== -->
<!-- Display in Slides (Presentation Mode) Only
========================================== -->
<!-- Display in Outline Mode Only
============================ -->
<!-- Display in Print Only
===================== -->
<!-- Incremental Display
=================== -->
<!-- This data file has been placed in the public domain. -->
<!-- Derived from the Unicode character mappings available from
<http://www.w3.org/2003/entities/xml/>.
Processed by unicode2rstsubs.py, part of Docutils:
<http://docutils.sourceforge.net>. -->
<dl class="docutils">
<dt><em>発表者</em></dt>
<dd><strong>宮國渡</strong></dd>
<dt><em>指導教官</em></dt>
<dd><strong>河野真治</strong></dd>
<dt><em>所属</em></dt>
<dd><strong>琉球大学 理工学研究科 情報工学専攻 並列信頼研究室</strong></dd>
</dl>

</div>
<div class="slide" id="id1">
<h1>研究の背景</h1>
<p>現在、学生実験で PS3Linux を用いてゲーム開発を行っているが、
学生には困難であることがわかってきている</p>
<ul>
<li><p class="first"><span class="text-maroon">問題1</span> : <span class="text-underline">Cell アーキテクチャプログラミング</span></p>
<ul>
<li><p class="first">Many Core による並列プログラミング</p>
<p>(データ、コードの分割の必要性)</p>
</li>
<li><p class="first">Cell の仕様 (DMA、データのアライメント、etc..)</p>
</li>
</ul>
</li>
<li><p class="first"><span class="text-maroon">問題2</span> : <span class="text-underline">ゲーム開発用の Framework が無い</span></p>
</li>
</ul>
<p>実験期間の大半を Cell の勉強に費やさねばならず、
開発されるゲームのレベルが例年一定以上にならない</p>
</div>
<div class="slide" id="id2">
<h1>研究目的</h1>
<p>Many Core Architecture を用いた並列プログラムの開発をサポートするフレームワーク <span class="text-maroon">Fine Grain Task Manager</span> を提案する</p>
<ul>
<li><p class="first">動作環境</p>
<ul class="simple">
<li>Mac OS X、Linux、PS3(Cell)</li>
</ul>
</li>
<li><p class="first">Fine Grain Task の単位</p>
<ul class="simple">
<li>サブルーチンまたは関数</li>
</ul>
</li>
<li><p class="first">Task Manager を用いた開発行程</p>
<ol class="arabic simple">
<li>逐次型プログラム</li>
<li>データやコードを分割したプログラム</li>
<li>並列に動かすプログラム</li>
</ol>
<p>各段階で信頼性を確保しながら開発を進める</p>
</li>
</ul>
</div>
<div class="slide" id="con-t">
<h1>研究目的 (Con't)</h1>
<dl class="docutils">
<dt><strong>Cerium</strong></dt>
<dd>Task Manager を用いた、PS3ゲーム開発用フレームワーク</dd>
</dl>
<p>Cerium は 3 つの機能で構成されている</p>
<ul class="simple">
<li>独自の <span class="text-maroon">Rendering Engine</span></li>
<li>ゲームに登場するオブジェクトやルールなど、ゲームを構成する要素を
木構造として持つ <span class="text-maroon">Scene Graph</span></li>
<li>Rendering Engine や Scene Graph の処理単位を Task とし、複数の Core へ
割り振りを行うカーネル <span class="text-maroon">TaskManager</span></li>
</ul>
<p>学生が Cell アーキテクチャを理解しながら、
期間内でゲーム開発が行える、シンプルな
マルチタスクフレームワークを目指す</p>
</div>
<div class="slide" id="id3">
<h1>発表の流れ</h1>
<ul class="simple">
<li>Cell アーキテクチャの概要</li>
<li>Many Core プログラミングの特徴</li>
<li>Task Manager の実装、例題</li>
<li>Cerium</li>
<li>比較</li>
<li>まとめと今後の課題</li>
</ul>
</div>
<div class="slide" id="cell">
<h1>Cell アーキテクチャの概要</h1>
<ul class="simple">
<li><span class="text-big">Cell アーキテクチャの概要</span></li>
<li><span class="text-silver">Many Core プログラミングの特徴</span></li>
<li><span class="text-silver">Task Manager の実装</span></li>
<li><span class="text-silver">Cerium</span></li>
<li><span class="text-silver">比較</span></li>
<li><span class="text-silver">まとめと今後の課題</span></li>
</ul>
</div>
<div class="slide" id="cell-broadband-engine">
<h1>Cell Broadband Engine</h1>
<div align="center" class="align-center"><img alt="images/cell_arch.jpg" class="align-center" src="images/cell_arch.jpg" style="width: 280px;" /></div>
<ul class="simple">
<li>1個の PPE と 8 個の SPE がリングバスで構成されている<ul>
<li>Linux 側から使える SPE は 6 個</li>
</ul>
</li>
<li>SPE は <span class="text-maroon">256KB</span> の Local Store (LS) を持つ</li>
<li>SPE からメインメモリへは直接アクセスできない<ul>
<li>SPE が持つ MFC (Memory Flow Controller) へ
<span class="text-maroon">DMA 命令</span> を送ることで行う</li>
</ul>
</li>
<li>128 ビットレジスタを用いて SIMD (Single Instruction Multiple Data) が可能</li>
</ul>
</div>
<div class="slide" id="id4">
<h1>Cell の基本機能</h1>
<p><strong>DMA</strong></p>
<ul class="simple">
<li>メインメモリと LS 間でデータが転送される</li>
<li>DMA 転送を行うにはいくつか条件がある<ul>
<li>データサイズは 16 バイトの倍数</li>
<li>転送元と転送先のアドレスが 16 バイト境界に揃えられている</li>
</ul>
</li>
</ul>
<p><strong>Mailbox</strong></p>
<ul>
<li><p class="first">SPE の MFC 内にある FIFO キュー</p>
</li>
<li><p class="first">PPE と SPE 間で 32 ビットメッセージの交換に用いられる</p>
<p>キューは 3 種類</p>
<ul class="simple">
<li>SPU Inbound Mailbox : PPE → SPE</li>
<li>SPU Outbound Mailbox : SPE → PPE</li>
<li>SPU Outbound interrupt Mailbox : SPE → PPE (割り込み)</li>
</ul>
</li>
</ul>
</div>
<div class="slide" id="many-core">
<h1>Many Core プログラミングの特徴</h1>
<ul class="simple">
<li><span class="text-silver">Cell アーキテクチャの概要</span></li>
<li><span class="text-big">Many Core プログラミングの特徴</span></li>
<li><span class="text-silver">Task Manager の実装</span></li>
<li><span class="text-silver">Cerium</span></li>
<li><span class="text-silver">比較</span></li>
<li><span class="text-silver">まとめと今後の課題</span></li>
</ul>
</div>
<div class="slide" id="id5">
<h1>定常的な並列度の必要性</h1>
<dl class="docutils">
<dt><strong>Amdahl 則</strong></dt>
<dd>元のプログラムの並列化率が低ければ、その性能を生かすことは出来ない</dd>
</dl>
<div align="center" class="align-center"><img alt="images/amdahl.jpg" class="align-center" src="images/amdahl.jpg" style="width: 360px;" /></div>
<div align="center" style="font-size: large;">
  6 CPU を使っても、プログラムの並列化率が 8 割程度では<br />
  3倍程度の性能向上しか得られない
</div><p>Amdahl 則より、恒常的に並列プログラムの並列度を維持する必要がある</p>
</div>
<div class="slide" id="id6">
<h1>プログラム及びデータの分割</h1>
<p>プログラム中の並列度は、以下の形で取り出すことが可能</p>
<table>
  <tr>
    <td style="border: 1px solid black;">
      <img src="images/manycore_data_split.jpg" width="350">
    </td>
    <td style="border: 1px solid black;">
      <img src="images/manycore_pipeline.jpg" width="350">
    </td>
  </tr>
  <tr>
    <td align="center">データ並列</td>
    <td align="center">パイプライン処理</td>
  </tr>
</table><p>上二つの処理を行うには、プログラムとデータの適切な分割が必要</p>
<ul class="simple">
<li>プログラムの分割<ul>
<li>for 文、木構造で処理する個々のステートメント</li>
</ul>
</li>
<li>データの分割<ul>
<li>自明には行えない可能性がある</li>
<li>分割できるデータ構造の採用が必要となる</li>
</ul>
</li>
</ul>
</div>
<div class="slide" id="id7">
<h1>Many Core の同期とデバッグ</h1>
<dl class="docutils">
<dt><strong>同期</strong></dt>
<dd>複数の CPU がデータの待ち合わせ、または、整合性を維持するために、他の CPU との待ち合わせを行うこと</dd>
</dl>
<ul class="simple">
<li>各 CPU が待ち合わせを行うと、並列度が下がってしまうため、同期自体を減らす必要がある</li>
</ul>
<div align="center">
  &darr;
</div><ul class="simple">
<li>各 CPU が独立に (ロック無しで) データにアクセスできる様にデータを分割すれば良い</li>
</ul>
<p><strong>デバッグ</strong></p>
<ul class="simple">
<li>並列プログラムの実行は非決定的<ul>
<li>非決定的 = 同じ状態で実行しても結果が異なる</li>
</ul>
</li>
<li>バグの状態を再現することが難しい</li>
<li>個々の CPU 上のデータを調べる必要がある</li>
</ul>
</div>
<div class="slide" id="id8">
<h1>並列プログラムの開発行程</h1>
<p>以下の段階において、それぞれ実装とテストを行う</p>
<ol class="arabic simple">
<li>C によるシーケンシャルな実装</li>
</ol>
<ul class="simple">
<li>アルゴリズムの確認</li>
</ul>
<ol class="arabic simple" start="2">
<li>並列実行を考慮したデータ構造を持つ実装</li>
</ol>
<ul class="simple">
<li>データ構造が変化しても 1. と結果が同じになるかを確認</li>
</ul>
<ol class="arabic simple" start="3">
<li>コードを分割し、それらをシーケンシャルに実行する実装</li>
</ol>
<ul class="simple">
<li>この段階まではアーキテクチャに依存しない</li>
<li>二分法によるデバッグが可能</li>
</ul>
<ol class="arabic simple" start="4">
<li>分割したコードを並列実行する実装</li>
</ol>
</div>
<div class="slide" id="task-manager">
<h1>Task Manager の実装</h1>
<ul class="simple">
<li><span class="text-silver">Cell アーキテクチャの概要</span></li>
<li><span class="text-silver">Many Core プログラミングの特徴</span></li>
<li><span class="text-big">Task Manager の実装</span></li>
<li><span class="text-silver">Cerium</span></li>
<li><span class="text-silver">比較</span></li>
<li><span class="text-silver">まとめと今後の課題</span></li>
</ul>
</div>
<div class="slide" id="id9">
<h1>Task Manager</h1>
<p>Task と呼ばれる、分割された各プログラムを管理する</p>
<ul class="simple">
<li>Task はサブルーチンもしくは関数</li>
<li>Task 同士の依存関係を考慮</li>
<li>実行状態になった Task を各 SPE に割り振る</li>
</ul>
<div align="center"><p class="small">Task Manager API</p>
<table border="1" class="small docutils">
<colgroup>
<col width="23%" />
<col width="77%" />
</colgroup>
<tbody valign="top">
<tr><td>create_task</td>
<td>Task の生成</td>
</tr>
<tr><td>allocate</td>
<td>実行環境のアライメントを考慮した allocator</td>
</tr>
</tbody>
</table>
<p class="small">Task API</p>
<table border="1" class="small docutils">
<colgroup>
<col width="19%" />
<col width="81%" />
</colgroup>
<tbody valign="top">
<tr><td>add_inData</td>
<td>Task の入力データの設定 (入力元アドレス、データサイズ)</td>
</tr>
<tr><td>add_outData</td>
<td>Task の出力データの設定 (出力先アドレス、データサイズ)</td>
</tr>
<tr><td>add_param</td>
<td>Task のパラメータ (32bits)</td>
</tr>
<tr><td>wait_for</td>
<td>Task の依存関係の考慮</td>
</tr>
<tr><td>set_cpu</td>
<td>Task を実行する CPU の設定</td>
</tr>
</tbody>
</table>
</div></div>
<div class="slide" id="gallium">
<h1>比較 - Gallium</h1>
<dl class="docutils">
<dt><a class="reference" href="http://www.tungstengraphics.com/wiki/index.php/Gallium3D">Gallium</a></dt>
<dd>オープンソースの 3D グラフィックドライバ</dd>
</dl>
<p>フレームバッファエンジン用のレンダリングエンジンである <a class="reference" href="http://www.mesa3d.org/">OSMesa</a> の
Cell ドライバとして用いられている</p>
<ul class="simple">
<li>Triangle (Polygon) を SPE に送り、その中から得られた Span に
テクスチャを貼ってレンダリングする</li>
<li>SPE は6 個使用</li>
<li>SIMD 演算を積極的に使用している。</li>
</ul>
<p>先行研究では Rendering Engine に OSMesa を使用していたため、
Cerium Rendering Engine のレンダリング手法は OSMesa を参考にしている</p>
</div>
<div class="slide" id="gallium-con-t">
<h1>比較 - Gallium (Con't)</h1>
<ul class="simple">
<li>先行研究 (神里)<ul>
<li>現在 PS3Linux からは <span class="text-maroon">GPU にアクセスできない</span></li>
<li><span class="text-maroon">フレームバッファは使用できる</span> ため、OSMesa を使用</li>
<li>OSMesa の機能の一部を SPE に乗せ、高速化に成功</li>
<li>ソースコードの複雑化を招いた<ul>
<li>OSMesa の元々の実装の影響 (巨大なマクロ、構造体)</li>
</ul>
</li>
<li>以降のメンテナンスや機能の追加、改良が困難と判断</li>
<li>独自に Rendering Engine を持つことに</li>
</ul>
</li>
<li>Gallium<ul>
<li>OSMesa の Cell Driver</li>
<li>OpenGL + Gallium でのゲーム開発は可能</li>
<li>PS3 上のゲーム開発において、レンダリングのみを SPE に実装するのでは足りない<ul>
<li>ゲームに登場するオブジェクトの計算 (衝突判定等)</li>
<li>Amdahl 則の問題</li>
</ul>
</li>
<li>レンダリングだけでなく、ゲームオブジェクトも SPE で処理できるように
しなければならない</li>
</ul>
</li>
<li>Cerium<ul>
<li>SceneGraph、レンダリングを SPE 上で処理する</li>
</ul>
</li>
</ul>
</div>
<div class="slide" id="id11">
<h1>比較 - Gallium (Con't)</h1>
<ul class="simple">
<li>実行速度比較<ul>
<li>出力解像度は 1920x1080</li>
<li>地球のテクスチャを貼った球体のオブジェクトを表示</li>
</ul>
</li>
</ul>
<div align="center" class="align-center"><img alt="images/com_gallium.jpg" class="align-center" src="images/com_gallium.jpg" style="width: 350px;" /></div>
<div align="center"><table border="1" class="docutils">
<colgroup>
<col width="55%" />
<col width="45%" />
</colgroup>
<tbody valign="top">
<tr><td>Gallium (SPE 6 個)</td>
<td>5.4 FPS</td>
</tr>
<tr><td>Cerium (SPE 1 個)</td>
<td>2.5 FPS</td>
</tr>
<tr><td>Cerium (SPE 6 個)</td>
<td><span class="text-maroon">9.5 FPS</span></td>
</tr>
</tbody>
</table>
</div></div>
<div class="slide" id="opengl">
<h1>比較 - OpenGL</h1>
<dl class="docutils">
<dt><a class="reference" href="http://www.opengl.org/">OpenGL</a></dt>
<dd>オープンソースの3Dグラフィックスプログラムインターフェース</dd>
</dl>
<ul class="simple">
<li>ポリゴンの描画</li>
</ul>
<div align="center" style="color: maroon; font-size: large;">
  // 線分3つ指定し、三角形を生成<br />
  glVertex3d(x1, y1, z1);<br />
  glVertex3d(x2, y2, z2);<br />
  glVertex3d(x3, y3, z3);<br />
</div><ul>
<li><p class="first">OpenGL での親子関係の表現</p>
<dl class="docutils">
<dt>glPushMatrix();</dt>
<dd><p class="first last">//現在処理してるオブジェクトの変換行列をスタックに登録</p>
</dd>
<dt>makePolygon();</dt>
<dd><p class="first last">//このオブジェクトは今まで Push された変換行列の影響を受ける</p>
</dd>
<dt>glPopMatrix();</dt>
<dd><p class="first last">//スタックから変換行列を取り出す</p>
</dd>
</dl>
</li>
</ul>
</div>
<div class="slide" id="opengl-con-t">
<h1>比較 - OpenGL (Con't)</h1>
<p>レンダリングは Cerium Rendering Engine を用いて、
ゲームオブジェクトの操作は OpenGL を用いることでゲーム開発は可能</p>
<ul class="simple">
<li>OpenGL が持つレンダリングドライバは使用せずに、オブジェクトの操作結果をポリゴンとして出力するためには、各オブジェクトの変換行列が必要<ul>
<li>各オブジェクトのパラメータは変換行列が掛けられる前の状態を保持</li>
</ul>
</li>
<li>変換行列は OpenGL が内部にもつ Matrix Stack に格納されている</li>
<li>Matrix Stack から、 <span class="text-maroon">各オブジェクトに対応する変換行列</span> を取り出す必要がある</li>
</ul>
<p>最初から自身の変換行列を持っている SceneGraph というデータ構造を用いれば、
SPE 上でオブジェクトの操作から変換行列による更新まで一括して行える</p>
</div>
<div class="slide" id="opencl">
<h1>比較 - OpenCL</h1>
<dl class="docutils">
<dt><strong>OpenCL</strong></dt>
<dd>マルチコアCPUやGPU、その他のプロセッサによる、ヘテロジニアスコンピューティングのフレームワーク</dd>
</dl>
<div align="center" class="align-center"><img alt="images/cp_opencl_plat.jpg" class="align-center" src="images/cp_opencl_plat.jpg" style="width: 300px;" /></div>
<ul class="simple">
<li>Host から PE へ実行コマンドが送られる</li>
<li>Host や OpenCL Device はコマンドの管理を行う kernel を持つ</li>
<li>OpenCL Device 毎に独立したメモリ領域を持つ</li>
<li>データ並列、タスク並列をサポート</li>
</ul>
</div>
<div class="slide" id="opencl-con-t">
<h1>比較 - OpenCL (Con't)</h1>
<p><strong>OpenCL</strong></p>
<ul class="simple">
<li>あらゆる Many Core Architecture に対応できるような汎用的な実装</li>
<li>開発環境にあわせた記述が必要</li>
</ul>
<p><strong>Task Manager</strong></p>
<ul class="simple">
<li>Cell アーキテクチャに重きを置いた記述</li>
<li>DMA によるメモリアクセスなど、決まった記述で開発できる</li>
<li>大幅なコードの変更無く Mac OS X や Linux など複数の環境で動作させることが可能</li>
</ul>
<p>Task Manager は <span class="text-maroon">OpenCL による実装の一つ</span> と言える</p>
<ul class="simple">
<li>学生が Cell アーキテクチャの理解、及び Cell プログラミングを行う際は
Task Manager が適している</li>
</ul>
</div>
</div>
</body>
</html>