Mercurial > hg > Papers > 2013 > yuhi-prosym
changeset 25:1e019b5d8577
rdtsc
author | Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Fri, 10 Jan 2014 16:06:16 +0900 |
parents | 330abf1bb892 |
children | d602bd03a4db |
files | presen/images/glaffle/.DS_Store presen/index.html |
diffstat | 2 files changed, 39 insertions(+), 10 deletions(-) [+] |
line wrap: on
line diff
--- a/presen/index.html Fri Jan 10 04:16:03 2014 +0900 +++ b/presen/index.html Fri Jan 10 16:06:16 2014 +0900 @@ -413,9 +413,8 @@ <td>z</td> <td>z座標の要素数</td> </tr> - </tbody> - </table> + </table> </article> </slide> @@ -424,6 +423,43 @@ <hgroup> <h3>ベンチマーク</h3> </hgroup> + <article> + <h3 class="yellow">実験環境</h3> + <table> + <tbody> + <tr> + <td>OS</td><td>MacOS 10.9.1</td> + </tr> + <tr> + <td>CPU</td><td>2*2.66GHz 6-CoreIntel Xeon</td> + </tr> + <tr> + <td>Memory</td><td>16GB</td> + </tr> + <tr> + <td>Compiler</td><td>Apple LLVM version 5.0<br>(clang-500.2.79)</td> + </tr> + <tr> + <td>GPU</td><td>AMD ATI Radeon HD 5870 1024MB</td> + </tr> + </tbody> + </table> + <p> + </p> + <h3 class="yellow">時間測定の方法</h3> + <ul> + <li>CPU</li> + RDTSC命令を用いて、CPUのクロックからタイムスタンプカウンタを取得し、時間の測定を行っている + <li>GPU</li> + OpenCLのAPI(clGetEventProfilingInfo)を用いて測定 + </ul> + </article> + </slide> + + <slide> + <hgroup> + <h3>ベンチマーク</h3> + </hgroup> <table > <tbody> <tr> @@ -437,13 +473,6 @@ フーリエ変換と周波数フィルタによる、 512*512の画像への処理をデータ並列で行う例題 </p> - <h3 class="yellow">実験環境</h3> - OS : MacOS 10.9.1<br> - CPU : 2*2.66GHz 6-CoreIntel Xeon<br> - Memory : 16GB<br> - Compiler : Apple LLVM version 5.0<br> - (clang-500.2.79)<br> - GPU : AMD ATI Radeon HD 5870 1024MB<br> <h3 class="yellow">結果</h3> <font size="5"> <p> @@ -458,7 +487,7 @@ </table> <dl> <ul> - <li>Run TimeはGPUが最も早い</li> + <li><font color="red">iterateを使用すると、GPU側が劇的に速い</font></li> <li>GPUはBusy Time以外の時間に大きく処理を割いている</li> <dd>おそらくデータの転送(IO)部分</dd> </ul>