Mercurial > hg > Papers > 2014 > masakoha-thesis > final
changeset 14:0e7c972b5ca1
write slide
author | Masataka Kohagura <e085726@ie.u-ryukyu.ac.jp> |
---|---|
date | Tue, 28 Jan 2014 18:17:39 +0900 |
parents | ff5c2b4ca18a |
children | 9b071b32e3de |
files | slide/index.html |
diffstat | 1 files changed, 13 insertions(+), 64 deletions(-) [+] |
line wrap: on
line diff
--- a/slide/index.html Tue Jan 28 00:48:21 2014 +0900 +++ b/slide/index.html Tue Jan 28 18:17:39 2014 +0900 @@ -23,62 +23,25 @@ slides below. --> <article > - <h1>Cerium TaskManagerのGPGPUのサポート</h1> - <h3 class="title">Yuhi TOMARI 21 Feb 2013</h3> + <h1>Cerium による並列処理向け I/O の設計と実装</h1> + <h3 class="title">Masataka Kohagura 12th, February</h3> <div align="right">担当教官 : 河野 真治</div> </article> <article > - <h3>研究概要</h3> + <h3>研究背景と目的</h3> <p> - 当研究室ではCellおよびLinux、 - Mac OSX上で動く並列プログラミングフレームワーク、 - Ceriumの開発・改良を行っている - </p> - <img src='images/cerium_resource.png' style="height:300px"> - <p> - <font color="#ff3300">本研究では新たにGPU上での並列実行に対応</font> + 近年のCPUのほとんどはマルチコアであり、それらの性能を引き出すためには並列プログラミングが必須となっている。そこで当研究室では Cerium Library の開発を行い、提供することによって並列プログラミングを容易にしている。 </p> <p> - これによりヘテロジニアス(異種混合)環境下<br>でのプログラミングをサポートする + 先行研究では Task の並列化によって、プログラム全体の処理速度は向上しているが、ファイル読み込み等の I/O に対して並列に Task が動作するようにはされていない。 </p> - - <!-- - <p> - CeriumにOpenCLを組み込む事でGpu上での並列実行にも対応すると、 - CPU・GPUそれぞれにtaskを割り振ることが可能となる。</p> - <p> - これにより、ヘテロジニアス(異種混合)な環境で - それぞれのアーキテクチャに適したプログラミングをサポートする。 - </p> - --> - - </article> - <article> - <h3>OpenCLによるGPGPUへの対応</h3> <p> - OpenCLは - ヘテロジニアス環境での並列計算を支援するフレームワーク - </p> - <table border="0" cellpadding="0" cellspacing="0"> - <tbody> - <tr> - <td><img src='images/opencl.png' style="height:120px"></td> - <td> - <p> - OpenCLのtaskはkernelと呼ばれ、OpenCL Cという - Cに似た独自の言語で記述される - </p> - </td> - </tr> - </tbody> - </table> - <p> - <h3 class='yellow'>CPU/Cell上で実行する場合とGPU上で実行する場合、<br> - それぞれほぼ同じ形式でkernelを記述できる</h3> + 本研究では I/O と Task の並列化の設計、実装によってプログラム全体の処理速度、処理効率を上げていく。 </p> </article> + <article> - <h3>Cerium Task Manager</h3> + <h3>Cerium とは</h3> <table border="0" cellpadding="0" cellspacing="0"> <tbody> <tr> @@ -98,24 +61,8 @@ CpuThreads、Schedulerに対応させる形でGpuThreadsとGpuSchedulerを作成した </p> </article> - <article class="nobackground"> - <h3>GPUのアーキテクチャ</h3> - <table border="0" cellpadding="0" cellspacing="0"> - <tbody> - <tr> - <td><img src='images/gpu_arch.png' style="height:400px"></td> - <td> - <p> - GPU上のローカルメモリはCPUとメモリ空間が異なるのでメモリの共有ができない。 - </p> - </td> - </tr> - </tbody> - </table> - <p> - メモリのコピー処理やTaskを順にCommand Queueに - enqueueする。enqueueされた処理は並列実行される - </article> + + <article> <h3>GPU Task実行の流れ</h3> <br> @@ -129,6 +76,7 @@ } </pre> </article> + <article> <h3>GPU Task 実行の流れ</h3> <br> @@ -155,6 +103,7 @@ </tbody> </table> </article> + <article class="nobackground"> <h3>GPU Task 実行の流れ</h3><br> <h3 class="yellow">GPU Task生成</h3> @@ -168,11 +117,11 @@ </pre> </article> - <article> <h3>Cerium OpenCL API比較</h3> <img src='images/api.png' style="height:500px"> </article> + <article class="nobackground"> <h3>ベンチマーク</h3> <table >