diff TaskManager/ChangeLog @ 1915:effb5653fd5c draft

update cuda, yet running
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Mon, 20 Jan 2014 21:59:56 +0900
parents e0d465efc57e
children
line wrap: on
line diff
--- a/TaskManager/ChangeLog	Mon Jan 20 19:02:22 2014 +0900
+++ b/TaskManager/ChangeLog	Mon Jan 20 21:59:56 2014 +0900
@@ -1,3 +1,21 @@
+2014-1-20 Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
+
+	cuda で clEnqueueNDRangeKernel に相当するものが cuLaunchKernel
+	OpenCL の場合は global_work_size(0)*...*global_work_size(work_dim-1) で起動する kernel の数が決まる。
+	cuda の場合は gridDim * blockDim で決まる。
+	ただし、gridDim と blockDim には最大数がある。gridDim は 2^16, blockDim は 2^9
+	いまの iterate では cuda に対応できない。
+
+	cuda には OpenCL の command_queue に相当するものがない。
+	stream が command_queue に近い。
+	複数の stream は並列に走らせることができる。
+		実行の順序は gpu 側で制御されるとか言う記述が...
+		out of order で実行される?
+	OpenCL も複数の command_queue を並列に走らせることができる?
+		command_queue も1つの queue に全部入れるんじゃなくて、command_queue を複数作ったほうがいい?
+		command_queue 同士で同期は取れるけど、べつの queue の event とか待てるのか?
+			command_queue の粒度は下げれば event 使わなくても出来そうな気がする。
+
 2014-1-4 Shinji kONO <kono@ie.u-ryukyu.ac.jp>
 
 	MY_SPE_STATUS_READY は task 終了を待ってから出しているが、あまり、望ましくない。