Mercurial > hg > Game > Cerium
diff TaskManager/ChangeLog @ 1915:effb5653fd5c draft
update cuda, yet running
author | Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp> |
---|---|
date | Mon, 20 Jan 2014 21:59:56 +0900 |
parents | e0d465efc57e |
children |
line wrap: on
line diff
--- a/TaskManager/ChangeLog Mon Jan 20 19:02:22 2014 +0900 +++ b/TaskManager/ChangeLog Mon Jan 20 21:59:56 2014 +0900 @@ -1,3 +1,21 @@ +2014-1-20 Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp> + + cuda で clEnqueueNDRangeKernel に相当するものが cuLaunchKernel + OpenCL の場合は global_work_size(0)*...*global_work_size(work_dim-1) で起動する kernel の数が決まる。 + cuda の場合は gridDim * blockDim で決まる。 + ただし、gridDim と blockDim には最大数がある。gridDim は 2^16, blockDim は 2^9 + いまの iterate では cuda に対応できない。 + + cuda には OpenCL の command_queue に相当するものがない。 + stream が command_queue に近い。 + 複数の stream は並列に走らせることができる。 + 実行の順序は gpu 側で制御されるとか言う記述が... + out of order で実行される? + OpenCL も複数の command_queue を並列に走らせることができる? + command_queue も1つの queue に全部入れるんじゃなくて、command_queue を複数作ったほうがいい? + command_queue 同士で同期は取れるけど、べつの queue の event とか待てるのか? + command_queue の粒度は下げれば event 使わなくても出来そうな気がする。 + 2014-1-4 Shinji kONO <kono@ie.u-ryukyu.ac.jp> MY_SPE_STATUS_READY は task 終了を待ってから出しているが、あまり、望ましくない。