Mercurial > hg > Members > kono > Cerium
annotate TaskManager/ChangeLog @ 184:907bda4a1a14
fix
author | gongo@gendarme.cr.ie.u-ryukyu.ac.jp |
---|---|
date | Tue, 06 Jan 2009 15:39:48 +0900 |
parents | df3cfc04e796 |
children | 72dcf908ec52 |
rev | line source |
---|---|
184 | 1 2009-01-05 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
2 | |
3 * all : fix | |
4 Scheduler::curIndex_taskList を削除し、 | |
5 SchedTask に持たせる様に変更。(SchedTask::__cur_index) | |
6 それに伴い、SchedTask::__init__() も cur_index を入れる様に変更 | |
7 | |
8 2008-12-24 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
9 | |
10 * kernel/schedule/SchedTask.cc (SchedTask::ex_init_renew) | |
11 (SchedTask::ex_init_normal): add | |
12 (SchedTask::__init__): fix | |
13 | |
14 init でも ex_init を使える様に。 | |
15 あと、コンストラクタで渡していた引数を __init__() に渡す様にした。 | |
16 コンストラクタの引数あると、継承する時にいちいち親クラスのも書かないと | |
17 いけなかった。これ省略できないんだよな。めんどくさい。 | |
18 | |
19 例. | |
20 class Hoge : public SchedTask { | |
21 Hoge(int i) : Task(i) {} | |
22 }; | |
23 | |
24 なので、今までは Scheduler.h に SchedConstructor ってマクロを書いて | |
25 クラス名入れるだけで上の様な形になるようにしていた。 | |
26 でも、例えば | |
27 | |
28 SchedTask -> Hoge -> Fuge っていうように Fuge ってタスクを | |
29 作りたいとき、上のままだと SchedTask に引数渡してしまうのでだめ。 | |
30 もうめんどくさいってことで、コンストラクタ全てデフォルトにして、 | |
31 __init__() の引数に渡す様にしました。 | |
32 | |
33 (SchedTask::__set_renewFlag): add | |
34 | |
35 ここで、PPEで生成されたか(normal)、SPE で生成されたか(renew) の | |
36 判定を行い、ex_xxx の設定もする | |
37 | |
38 (SchedTask::get_inputSize, SchedTask::get_outputSize): add | |
39 | |
40 アドレスだけじゃなく、そのサイズも取れた方がいいだろう | |
41 | |
42 | |
182
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
43 2008-12-23 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
44 |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
45 * Cell/spe/SchedTask.cc (SchedTask::get_outputAddr) |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
46 (SchedTask::get_inputAddr): add |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
47 |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
48 in/out のデータだけじゃなく、そのアドレスも取れた方がいいだろう |
df3cfc04e796
add get_inputAddr, get_outputAddr
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents:
180
diff
changeset
|
49 |
180
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
50 2008-12-22 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
51 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
52 * Cell/spe/SchedTask.cc (SchedTask::__init__, SchedTask::read) |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
53 (SchedTask::exec, SchedTask::write): fix |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
54 (SchedTask::ex_read_normal, SchedTask::ex_read_renew) |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
55 (SchedTask::ex_exec_normal, SchedTask::ex_exec_renew) |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
56 (SchedTask::ex_write_normal, SchedTask::ex_write_renew): add |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
57 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
58 SPE 内で生成されたタスクは、PPE で生成されたものと違い |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
59 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
60 - add->inData |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
61 : PPE から DMA or SPE 内のものをそのまま使う |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
62 - PPE にタスクが終了したことを知らせる |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
63 : 生成されたタスクを待つ必要があるなら、その時点では送らない |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
64 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
65 とか、まあいろいろ処理が違うわけです。 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
66 そして、タスク内生成タスクの判断をする |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
67 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
68 __flag_renewTask ? 0 = PPE で生成 : 1 = SPE で生成 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
69 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
70 という変数がある。これでいくつか処理を分けてるんだけど、 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
71 今までは |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
72 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
73 if (__flag_renewTask) { |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
74 } else { |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
75 } |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
76 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
77 ってやってた。これではいかんという事で、 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
78 __init__() 内で、関数ポインタに、 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
79 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
80 ex_xxxx_normal: PPE で生成されたタスクに対する処理 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
81 ex_xxxx_renew: SPE で生成されたタスクに対する処理 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
82 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
83 と入れて、if 文無しでやってみた。 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
84 今は ex_write_xxx しか書いてないが、これからread/exec でも |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
85 出てくると思うので、作っておいた |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
86 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
87 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
88 2008-12-19 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
89 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
90 * Cell/spe/CellDmaManager.cc (CellDmaManager::dma_wait) |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
91 (CellDmaManager::mail_write, CellDmaManager::mail_read): fix |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
92 writech、readch の関数を、wrap (って言い方でおk?)された関数に変更。 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
93 最適化掛かってるっぽいし、長いよりはわかりやすいし。そのための wrap。 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
94 |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
95 例: |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
96 - before |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
97 spu_readch(SPU_RdInMspu_readch(SPU_RdInMbox); |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
98 - after |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
99 spu_read_in_mbox(void); |
5cde66c926b4
いろいろ fix 。詳しくは TaskManager/Changelog、test_render/Changelog を
gongo@localhost.localdomain
parents:
109
diff
changeset
|
100 |
109 | 101 2008-11-05 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
102 | |
103 * add: Task 内での API | |
104 Task 外での API は、今まで通り manager->create_task とかですが | |
105 タスク内でも、「オブジェクト->関数」の呼び出しがいいんじゃないか | |
106 って話になったので、付け加えました。今のところ、SchedTask.h の | |
107 内部クラスとして | |
108 | |
109 STaskManager | |
110 | |
111 ってのを加えて、ユーザはそのインスタンスである | |
112 | |
113 smanager | |
114 | |
115 からAPIにアクセスします。 | |
116 今までは __scheduler->dma_load とかいろいろやってたんですが | |
117 これからは全て smanager にしました。 | |
118 というわけで、ここに使える API 一覧。いずれゲーム班 wikiの方にも。 | |
119 | |
120 - get_input, get_output, get_param | |
121 - create_task, wait_task | |
122 - global_alloc, global_get, global_free | |
123 - mainMem_alloc, mainMem_wait, mainMem_get | |
124 - dma_load, dma_store, dma_wait | |
125 - allocate | |
126 | |
127 使い方は追々描きますが、 | |
128 今のところ上に変更しなくてもそのままの記述で動くはずです。 | |
129 いずれは全て移行してもらうことになりますがきっと。 | |
130 | |
131 | |
132 * kernel/schedule/SchedTask.cc: | |
133 いろいろ関数が増えてますが、ラッパーです。 | |
134 | |
135 2008-11-01 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
136 | |
137 * add: kernel/main.cc | |
138 main loop をユーザに書かせるのはめんどくさいので、 | |
139 ライブラリ側で main() を書く事にしました。 | |
140 ユーザ側では main() の代わりに cerium_main() を | |
141 書かせるようにしています。引数は main() のをそのまま渡す感じで。 | |
142 | |
143 Cerium 標準のオプションとして、-cpu は付けました。 | |
144 ゲームフレームワークってことで、-width とか -height は | |
145 標準でつけてもいいかなって話なので、これは後日実装。 | |
146 標準オプションで受け取った値にアクセスする方法も考えないと。 | |
147 manager->cpu とか manager->width とかは安易か? | |
148 | |
149 * add: Cell/PpeScheduler.cc | |
150 MainScheduler をそのまま使うと、 | |
151 PPE のタスクで mainMem_alloc で確保した領域がアライメント | |
152 取れていないため、SPE で使うと余裕でバスエラー。 | |
153 | |
154 Scheduler->allocate で poxis_memalign で使えるように。 | |
155 | |
156 * move: kernel/schedule/FifoDmaManager.cc, MainScheduler.cc | |
157 kernel というよりは Fifo バージョン用なので Fifo/ に移動。 | |
158 | |
159 | |
160 2008-10-21 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
161 | |
162 * kernel/ppe/TaskManagerImpl.cc (TaskManagerImpl::systask_init): fix | |
163 下に述べてる SysTask_Finish を regist する部分 | |
164 | |
165 (TaskManagerImpl::spawn_task): | |
166 | |
167 SysTask_Finish に対して、タスクが spawn されるたびに | |
168 wait_for を掛けて、待つようにしている。 | |
169 | |
170 * add: kernel/systask/ | |
171 久々の更新乙 | |
172 | |
173 プログラム動かすとき、タスクが SPE だけで、 | |
174 PPE で待ってるタスクが無いとそのままプログラムが素通りするってことで | |
175 今まではユーザに、全てのタスクを待たせるタスクってのを書かせてた。 | |
176 まあもちろんめんどくさいので、いい加減追加した。 | |
177 | |
178 system task っつーことで、spawn された全てのタスクを待つ | |
179 SysTask_Finish を作った。これでいちいち task_finish とか作らなくておk | |
180 | |
181 2008-08-10 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
182 | |
183 * thinking: add_update() ? | |
184 現在、タスクは input/output があるわけですよ。 | |
185 で、例えば | |
186 | |
187 - 入力データ : PolygoPpack | |
188 - 出力データ : SpanPack | |
189 | |
190 ってなわけですが、別のタスクで | |
191 | |
192 - 入力データ : SceneGraphPack (更新前) | |
193 - 出力データ : SceneGraphPack (更新後) | |
194 | |
195 ってのがある。つまり Update なわけだ。 | |
196 今のところ、同じアドレスを add_inData, add_outData に設定して | |
197 タスク内で memcpy(wbuf, rbuf, sizeof(SceneGraphPack) とかしてる。 | |
198 まあそれはそれでいいのかわるいのか。 | |
199 | |
200 in/out だけじゃなくて update も必要? | |
201 | |
202 2008-08-08 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
203 | |
204 * add: ../include/TaskManager/base.h | |
205 通常の new/delete では、RTTI とか 例外処理とかで | |
206 -fno-exceptions や -fno-rtti をコンパイルオプションにしても | |
207 効かなかったんだけど、operator new/delete をオーバーライドして | |
208 中身を普通の malloc/free にすると、上の処理が無くなるので | |
209 オプションが効くようになる。結果コードサイズも減ると。 | |
210 SPE の場合、70〜80KBは減りました。使わない手は無い。 | |
211 つーことで、一応動いてる。。。といいたけど動いてないorz | |
212 最適化 (-O2 とか -O9) をかけると止まる。SPE 上でね。 | |
213 FIFO バージョンだと問題ない。SPEだとだめだ。 | |
214 今わかってる、止まる場所は Scheduler::run() 内の | |
215 | |
216 task3->write(); | |
217 | |
218 だ。task1~3までのnewは(多分)できているんだけど | |
219 そこを呼び出すと SPE 自体が終了してしまう。謎だ | |
220 | |
221 一応、俺作の new/delete は base.h に定義してあって、 | |
222 通常の API との切り替えは、base.h にある | |
223 BASE_NEW_DELETE を切り替えるだけでおk。 | |
224 全てのファイルではなく、現在は SPE で使いそうなところだけやってます。 | |
225 いずれは全部やったほうがいいかな〜 | |
226 | |
227 ライブラリ側の最適化はアウトだけど、ユーザ側では問題ないです。 | |
228 なので、今は | |
229 | |
230 ライブラリ側(libspemanager.a)は最適化無し(-O0) | |
231 ユーザ側(SchedTaskを継承したやつね)は最適化しても無問題 (-O9) | |
232 | |
233 でっす。ここらへん完璧なれば、だいぶ楽になる。 | |
234 つーかもう C++ やめ(ry | |
235 | |
236 | |
237 2008-08-07 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
238 | |
239 * change: mainMem_set -> mainMem_wait | |
240 allocate を待つんだから、なんとなく wait かな。 | |
241 あと、ユーザも使えるので、wait の方がわかりやすいと思ったり。 | |
242 | |
243 2008-08-05 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
244 | |
245 * add: mainMem_alloc, mainMem_set, mainMem_get | |
246 SPE から メインメモリの領域に対して allocate できないと | |
247 SceneGraphの生成やら、結構クリティカルな処理を | |
248 全部 PPE でやらないといけなくなるってことで実装しました。 | |
249 | |
250 流れとして | |
251 | |
252 1 タスク中に、mainMem(id,size) を実行する事で、 | |
253 メインメモリに対して allocate のコマンドを発行。 | |
254 | |
255 1.1 Scheduler から PPE に対して | |
256 - commmand (MY_SPE_COMMAND_MALLOC) | |
257 - id (PPEから戻ってくるコマンドに必要) | |
258 - size | |
259 を mailbox で送る | |
260 | |
261 1.2 確保した領域はそのタスク内では取得できない(NULL が来ます) | |
262 正確には、返事の mail をここでは read してないから | |
263 | |
264 2. PPE では、受信した mail が MY_SPE_COMMAND_MALLOC だったら | |
265 次に来る mail が id と size であるとして read を行い、 | |
266 size を元に allocate する。allocate が完了したら | |
267 - id | |
268 - allocate された領域のアドレス | |
269 を SPE に mail で送る | |
270 | |
271 3. SPE Scheduler では、SchedTaskList::read で、 | |
272 一つ前の TaskList 中で実行された mainMem_alloc の数だけ | |
273 PPE からのメールを待つ。mainMem_set() の処理です。 | |
274 | |
275 4. create_task されたタスク内で mainMem_get(id) とすると | |
276 allocate したメインメモリ領域のアドレスが得られる。 | |
277 | |
278 こんな感じ。結構ださい実装なので、もうちょいスマートにいきたいよね。 | |
279 例題は Game_project/student/master/gongo/MainMemMalloc にあります。 | |
280 README にもおんなじこと書いてます。 | |
281 | |
282 * memo: The number of available entries of Inbound/Outbound Mailbox | |
283 Outbound (SPE -> PPE) のmailboxデータキュー保持数は | |
284 | |
285 /* SPE プログラム中 */ | |
286 #include <spu_mfcio.h> | |
287 spu_stat_out_mbox(void); | |
288 | |
289 で調べる事が出来る。 | |
290 | |
291 --- 記述例 --- | |
292 printf("Available capacity of SPU Outbound Mailbox\n"); | |
293 printf(" %d\n", spu_stat_out_mbox()); | |
294 | |
295 --- 実行結果 -- | |
296 Available capacity of SPU Outbound Mailbox | |
297 1 | |
298 | |
299 Inbound (PPE -> SPE) の mailbox データキュー保持数は | |
300 | |
301 /* PPE プログラム中 */ | |
302 #include <libspe2.h> | |
303 spe_in_mbox_status(spe_context_ptr_t); | |
304 | |
305 で調べられます。 | |
306 | |
307 --- 記述例 --- | |
308 printf("the number of available entries = %d\n", | |
309 spe_in_mbox_status(spe_ctx)); | |
310 | |
311 --- 実行結果 --- | |
312 the number of available entries = 4 | |
313 | |
314 Outbound が少ないなー。 | |
315 In/Out 共に、キューが MAX の場合、減るまで wait 掛かるんだよな。 | |
316 それがどこまで影響あるかは実際にやらないと、ってことか。 | |
317 | |
318 * fix: ファイル名の変更 (*.cpp -> *.cc) | |
319 前々から先生に直せ言われてたので。 | |
320 | |
321 cvs のファイル名を変える方法は簡単に二つ(てかこれだけ?) | |
322 | |
323 1. cvs rm hoge.cpp; cvs add hoge.cc | |
324 2. リポジトリを直接変更 mv hoge.cpp,v hoge.cc,v | |
325 | |
326 めんどくさかったので 2 でやりました。 | |
327 Attic (削除されたファイルがあるリポジトリディレクトリ?)にも | |
328 同じ処理を行えば、tag で update かけてもちゃんと反映されました。 | |
329 | |
330 2008-07-22 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
331 | |
332 * tag: open-campus-2008 | |
333 次やる事は、Cell/spe 以下のコードサイズを減らすために | |
334 new/delete を消して malloc/free で統一する事。 | |
335 placement_new ってのを使えば、コンストラクタは呼べて | |
336 new ほどサイズ圧迫しないからこれにしようかな。 | |
337 逆の placement_delete ってのは自分で小細工しないと行けないらしい。 | |
338 まあ、これが旨く行けば 80KB ほど減るから。やるべきだろう。 | |
339 | |
340 * Cell/spe/Scheduler.cpp (Scheduler::dma_load): アホなミスその2 | |
341 自分で __scheduler->dma_store をやってもデータが送れない。 | |
342 そんな馬鹿な。つーことでいろいろ調べてもわからない。 | |
343 アドレスやサイズが違うのかと調べても違う。 | |
344 こうなったらっつーことでライブラリに printf 加えてみたら表示されない | |
345 あれ、おかしいな。たしかに Connector::dma_store に加えたはz・・ | |
346 | |
347 Scheduler::dma_store(void *buf, uint32 addr, uint32 size, uint32 mask) | |
348 { | |
349 <<< | |
350 connector->dma_load(buf, addr, size, mask); | |
351 ======== | |
352 connector->dma_store(buf, addr, size, mask); | |
353 >>> | |
354 } | |
355 | |
356 なぜ store から load を呼んでるのか不思議だった。 | |
357 Scheduler::dma_load をコピペして dma_store にした後、 | |
358 中の connector->dma_load を変えなかったってオチだな。 | |
359 下のミスと合わせて5,6時間費やしたよHAHAHA | |
360 | |
361 * Cell/spe/SchedTask.cpp (SchedTask::exec): アホなミスその1 | |
362 Test/test_render で、 | |
363 SpanPack のデータが時々壊れてる感じがする。 | |
364 送る前までは正常だから生成に問題は無いはず。 | |
365 つーことでいろいろ調べたがわからず。 | |
366 printf デバッグすると動く不思議 | |
367 なんだ、printf で遅くなったらできるってことは | |
368 DMA が完了する前に SchedTask::run にきてんのか? | |
369 いやいや、そんなばかな。だってちゃんと wait し・・・ | |
370 | |
371 <<< | |
372 ============ | |
373 __scheduler->dma_wait(DMA_READ); | |
374 >>> | |
375 | |
376 はいはい wait し忘れ wait し忘れ | |
377 | |
378 2008-07-16 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
379 | |
380 * memo: if 文消した成果2 & memcpy するかしないかか | |
381 Renew Task では、inListData,outListData は新たに allocate して | |
382 使っているので、SchedTask にそって実行する場合、 | |
383 | |
384 __scheduler->dma_load(__inListData, (uint32)__task->inData, | |
385 sizeof(ListData), DMA_READ_IN_LIST); | |
386 __scheduler->dma_load(__outListData, (uint32)__task->outData, | |
387 sizeof(ListData), DMA_READ_OUT_LIST); | |
388 | |
389 の代わりに | |
390 | |
391 memcpy(__inListData, __task->inData, sizeof(ListData)); | |
392 memcpy(__outListData, __task->outData, sizeof(ListData)); | |
393 free(__task->inData); | |
394 free(__task->outData); | |
395 | |
396 もしくは | |
397 | |
398 __inListData = __task->inData; | |
399 __outListData = __task->outData; | |
400 (__task->inData と __task->outData は Destructor で free する) | |
401 | |
402 とやっています。 | |
403 memcpy が重いのはわかるんですが、下の方法では | |
404 Destructor で if 文使って free() しているわけです(このタスクが Renew か否か)。 | |
405 ですので、どっちが早いか試してみた。 | |
406 | |
407 /** | |
408 * memcpy() して、すぐ free() する version | |
409 */ | |
410 void | |
411 test_cpy(int flag, int *src) | |
412 { | |
413 if (flag) { | |
414 memcpy(data, src, sizeof(int)*length); | |
415 free(src); | |
416 } | |
417 } | |
418 | |
419 /** | |
420 * 参照で扱って、最後に free() する version | |
421 */ | |
422 void | |
423 test_nocpy(int flag, int *src) | |
424 { | |
425 if (flag) { | |
426 data = src; | |
427 } | |
428 | |
429 // この部分を SchedTask::~SchedTask() と | |
430 // 思ってください | |
431 if (flag) { | |
432 free(data); | |
433 } | |
434 } | |
435 | |
436 | |
437 これらの関数を10000回ループしました。 | |
438 src の allocate は関数の外でやっており、その部分は実行時間に含まれてません | |
439 flag は 1 or 0 の繰り返しです。 | |
440 | |
441 - 実行結果 (1) | |
442 :no copy | |
443 SPE time by SPU Decrementer: 0.035500 | |
444 :copy | |
445 SPE time by SPU Decrementer: 0.057500 | |
446 | |
447 memcpy しないほうが速いらしいです。 | |
448 ためしに、flag を ずっと 1 にしてみました。 | |
449 | |
450 - 実行結果 (2) | |
451 :no copy | |
452 SPE time by SPU Decrementer: 0.055250 | |
453 :copy | |
454 SPE time by SPU Decrementer: 0.053389 | |
455 | |
456 今度は copy するほうが早いという不思議。 | |
457 でもまあ、ずっと 1 ってことはないと思いますし、 | |
458 むしろ flag == 1 になるほうが少ないと思うので、 | |
459 no_copy version でやったほうがいいかな。 | |
460 | |
461 おまけで、実行結果 (1) の環境で、test_nocpy を変えてみた | |
462 | |
463 void | |
464 test_nocpy(int flag, int *src) | |
465 { | |
466 if (flag) { | |
467 data = src; | |
468 } | |
469 | |
470 free((void*)(flag*(int)data)); | |
471 } | |
472 | |
473 キャストしまくりですが、単純に free(flag*data) だと | |
474 「invalid operands of types 'int' and 'int*' to binary 'operator*'」って | |
475 出るので、キャストで逃げました。 | |
476 で、実行結果なんですが | |
477 | |
478 - 実行結果 (3) | |
479 :no copy | |
480 SPE time by SPU Decrementer: 0.040375 | |
481 :copy | |
482 SPE time by SPU Decrementer: 0.059500 | |
483 | |
484 遅くなってーら。キャストが悪いのか。乗算が重いのか。 | |
485 branch が無い? spe の if 文と対決しても遅いのかー。 | |
486 例題が間違ってる可能性もあるが・・・ if 文は使っていくかなー | |
487 | |
488 | |
489 2008-07-10 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
490 | |
491 * fix: TaskGroup->group | |
492 今まで slist っていう、ライブラリの単方向リスト構造体?を | |
493 使ってたんだけど、まあいろいろあって、TaskQueue を使うようにしました。 | |
494 最初からこれにするつもりではあったけどね。 | |
495 RenewTask や static_alloc とかの実装を優先したので | |
496 ライブラリを使いました。といっても、書いてみると | |
497 それほと記述量無いので最初から行っても良かったかなーと思ったり。 | |
498 | |
499 そんなわけで動いてます。つーか、やめてよかったよ slist。 | |
500 slist を使ったやつと使ってない奴のファイルサイズがやばい | |
501 | |
502 -rwxr-xr-x 1 gongo gongo 120672 2008-07-10 14:29 spe-main* | |
503 -rwxr-xr-x 1 gongo gongo 180368 2008-07-10 13:40 spe-main.bak* | |
504 | |
505 .bak が slist を使ってる、上のやつが使ってないversionです。 | |
506 まさか 60k も違ってくるとは思わなかった。 | |
507 SPE LS の容量が 256k と考えると、かなりの痛手だったよ。アブねえ。 | |
508 インラインとか最適化掛けまくってて、コード量が増えてるからかなー。 | |
509 | |
510 「SPU C/C++ 言語拡張」とかで、C++ のライブラリがSPUでも使えるよ〜 | |
511 って書いてたから入れてみたんだけど。罠だったか。 | |
512 おそらく SPU に移植した側の人も「サイズが増えるのを覚悟で使え」って | |
513 ことだったんだろう。なかったら文句言う人も居そうだし。 | |
514 | |
515 2008-07-09 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
516 | |
517 * fix: TaskGroup での task の扱い | |
518 下にもかいているけど (直したいところ (1)) | |
519 TaskGroup->group が持つ要素は int で持ってて、 | |
520 それらは、同じく TaskGroup が持つ cur_id をインクリメントしていって、 | |
521 それを要素としていました。つまり、TaskGroup->group は、厳密にいえば | |
522 「どの Task があるか」ではなく、「いくつのタスクがあるか」を | |
523 あらわしているだけでした。slist を使う意味もなかったわけです。 | |
524 | |
525 そこで、SchedTask が持つ、RenewTaskList の解放のタイミングを | |
526 RenewTaskList の一番最後のタスクが delete されるときにしました。 | |
527 これによって、アドレスが被ることがなくなったので | |
528 TaskGroup->group の要素を TaskPtr にできました。 | |
529 この方が、TaskGroup の意味的にもしっくりくるのでよかばってん。 | |
530 | |
531 * memo: if 文消した成果 | |
532 | |
533 #ifdef FREE_TEST | |
534 free((ListDataPtr)(__flag_renewTask*(int)(__inListData))); | |
535 free((ListDataPtr)(__flag_renewTask*(int)(__outListData))); | |
536 free((TaskListPtr)(__flag_renewTask*(int)(__list))); | |
537 #else | |
538 if (__flag_renewTask) { | |
539 free(__inListData); | |
540 free(__outListData); | |
541 free(__list); | |
542 } | |
543 #endif | |
544 | |
545 こんな感じで、いくつかか if 文を消してみた。 | |
546 そして、PPE側の main.cc で gettimeofday で計測してみた (各10回) | |
547 | |
548 | |
549 - if 文消した場合 | |
550 time: 1.222000 | |
551 time: 1.230000 | |
552 time: 1.241000 | |
553 time: 1.230000 | |
554 time: 1.223000 | |
555 time: 1.257000 | |
556 time: 1.219000 | |
557 time: 1.228000 | |
558 time: 1.220000 | |
559 time: 1.229000 | |
560 avarage: 1.2299 | |
561 | |
562 - if 文消してない場合 | |
563 time: 1.225000 | |
564 time: 1.215000 | |
565 time: 1.229000 | |
566 time: 1.218000 | |
567 time: 1.223000 | |
568 time: 1.214000 | |
569 time: 1.225000 | |
570 time: 1.215000 | |
571 time: 1.224000 | |
572 time: 1.219000 | |
573 avarage: 1.2207 | |
574 | |
575 あまり変わらな(ryむしr(ry | |
576 使い方がまずいのか、もっとと回数を増やせば変わってくるのかね。。。 | |
577 PPE でなく、 SPE のほうで計測すべきなのかなーとか思ったり思わなかったり。 | |
578 | |
579 | |
580 2008-07-08 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
581 | |
582 * add: Renew Task の wait | |
583 Renew Task は今まで「生成されたやつ全部待つ」だったのを | |
584 | |
585 void SchedTask::wait_task(TaskPtr task); | |
586 | |
587 ってのを作って、任意のタスクに wait 掛けれるようにしました。 | |
588 名前が思いつかなかったお。。。 | |
589 動作確認済み・・・だと思います。例題・・・誰か例題を!(俺が | |
590 | |
591 | |
592 * fix: SchedTask の変数名 | |
593 ユーザが継承して使う SchedTask クラスなんですが、 | |
594 今まで変数は list, task などを使ってました。 | |
595 が、これは一般に使われやすい変数名です。 | |
596 その証拠に、俺も例題書いている時に task って名前が被ってました。 | |
597 | |
598 run(r, w) | |
599 { | |
600 ... | |
601 | |
602 //TaskPtr task; <= 宣言してないのにエラーにならない | |
603 task = create_task(TASK_EXEC); | |
604 } | |
605 | |
606 ってコードを書いてたせいで、Scheduler が使用する task を | |
607 上書きしたせいでバグってました。ってことがありました。 | |
608 上のように、宣言してないのに普通に通ってるのを気づきませんでした。 | |
609 今のところ変数名は __task とか __list にしてあります。 | |
610 private にしてもいいんだけどさ。 | |
611 | |
612 | |
613 2008-07-07 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
614 | |
615 * fix: if 文を無くしてみた | |
616 下の方に 「if () が多い」って書きましたが、いろいろ小細工を。 | |
617 SchedTask をやってみました。例えば | |
618 | |
619 if (cmd != 0) { | |
620 delete taskGroup; | |
621 scheduler->mail_write(cmd); | |
622 } | |
623 | |
624 ってのがありました。cmd ってのは taskGroup->status で | |
625 もし cmd が 0 でなければ、taskGroup はすでに空っぽで | |
626 待つべきタスクはすべて終了したので、taskGroup を delete し、 | |
627 mailbox で cmd を PPE に送ります(cmd にはすでに送るべきコマンドがある) | |
628 でまあ、これくらいなら | |
629 | |
630 delete (int*)((cmd != 0)*(int)(taskGroup)); | |
631 scheduler->mail_write(cmd); | |
632 | |
633 ぐらいに直せました。 | |
634 delete や free では NULL を渡しても何もしない(?)って動作なので | |
635 これでも問題ない。つまり、cmd == 0 なら、taskGroup を | |
636 解放する必要は無いので NULL が delete に渡されるわけです | |
637 int* でキャストしてるのは、そのまま 0 を渡すと、 | |
638 「int型を delete するのはできない」的なエラーがでるからです。 | |
639 。。。だったら int* じゃなくて TaskGroupPtr じゃね?とか思った今。 | |
640 | |
641 あと、PPE 側で 「mail == 0 なら NOP」 的な処理を入れました。 | |
642 これによって、cmd が 0 かその他で if を書く必要がなくなりました。 | |
643 問題があるとすれば、 SPE -> PPE の mailbox の queue の長さ。 | |
644 NOP コマンドを送って、queue の制限に引っかかって | |
645 mail_write が止まるんじゃないかなーとか少し心配です。 | |
646 ここらへんは optimize の時間に考える事かな。 | |
647 どうせ PPE では mail しか読んでないし、 | |
648 そこまで queue が埋まる事は無いと思いたい。 | |
649 | |
650 | |
651 | |
652 あとはこんな感じかな | |
653 | |
654 #if 1 // fix | |
655 free((void*)(flag_renewTask*(int)(list))); | |
656 #else | |
657 if (flag_renewTask) { | |
658 free(list); | |
659 } | |
660 #endif | |
661 | |
662 動いてるのは確認したし、gdb で x/20i とかしたら | |
663 branch 命令が減ってるのは確認した。 | |
664 まあ -O9 とかで最適化掛けるとどっちも同じになるけどな。 | |
665 | |
666 | |
667 * add (API): static_alloc, static_get, static_free | |
668 SchedTask 自身だけが持つ領域ではなく、 | |
669 SPE 上に複数のタスクが共有したい領域を作る | |
670 これは task::run() 内で使用する。 | |
671 | |
672 - void* static_alloc(int id, int size); | |
673 @param [id] 領域ID。現在は 0〜31 まで使用可能 (Scheduler.h で定義) | |
674 @param [size] 領域のサイズ | |
675 @return allocate した領域のポインタ。下の static_get の返り値と同じ | |
676 | |
677 - void* static_get(int id); | |
678 @param [id] static_alloc で作った領域 ID。 | |
679 @return 領域のポインタ | |
680 | |
681 - void static_free(int id); | |
682 @param [id] 解放したい領域の ID | |
683 | |
684 こんな感じかなー。 | |
685 static_free はさすがにユーザに任せるだろう。 | |
686 static_free し忘れると SPE には致命的なので、ここはよく伝える必要有 | |
687 | |
688 例題は | |
689 cvs: firefly:Game_project/student/master/gongo/Static | |
690 | |
691 まあ Renew と大体同じですけどね。 | |
692 int 型配列 data を共有にして、各タスクでインクリメントしてる | |
693 | |
694 * TODO: TaskGroup の扱い | |
695 通常の Task では、task->self には | |
696 自分が終了した時に PPE に送るコマンド(自分自身)になりますが、 | |
697 タスク中に生成されたタスク(もう何度も書くのめんどいんで Renew で)では | |
698 task->self は、task を待っている TaskGroup を表します。 | |
699 | |
700 self という名前で意味が違うのでこういうことはやめたいんだが。。。 | |
701 といいながらやめないのが(ry | |
702 | |
703 * memo: | |
704 下の 直したいところ (1) ってやつがよくわからんので、 | |
705 現在の状況だけ | |
706 | |
707 scheduler->add_groupTask() をするたびに | |
708 | |
709 group.insert_front(cur_id++); | |
710 | |
711 されます。 | |
712 そして、scheduler->remove_groupTask() されると | |
713 | |
714 group.remove(--cur_id); | |
715 | |
716 されます。要するに、どのタスクでも | |
717 cur_id だけが insert/remove されます。 | |
718 「どのタスクがあるか」ではなく「どれだけのタスクがあるか」ですね。 | |
719 実際にはしっかりと TaskPtr で管理したかったんですが、 | |
720 下にも書いたアドレスが被る云々の問題でそれもできず。 | |
721 やり方はあると思うんですが。 | |
722 | |
723 うーん、うまく説明できないな。 | |
724 | |
725 * tag: v20080707 | |
726 タスク内タスク生成を作りました。 | |
727 | |
728 [TODO] | |
729 SPE 上で領域を共有する API の | |
730 | |
731 - static_alloc | |
732 - static_get | |
733 - static_free | |
734 | |
735 を速攻で実装しよう。。 | |
736 | |
737 * add: タスク内タスク生成 | |
738 一応できたんですが、直したい。。。 | |
739 仕様としては | |
740 | |
741 - 現在のタスク(T1) の中でタスクを生成したとする (Tc = T2, T3, ...) | |
742 - 本来、T1 が終了次第、T1 が終わった事を PPE に伝えるが、 | |
743 ここでは、Tc が全て終わってから、T1 の終了を PPE に伝える | |
744 - Tc 内で再びタスクが生成されても(Tcc)、Tcc が終わってから T1 を(ry | |
745 | |
746 現在は、生成したタスクすべてに対して wait_for をかけてる感じ。 | |
747 しかし、例えば Frame Buffer に書き込む時は待つ必要ない(はず)なので | |
748 タスク毎に wait_for を選べるようにした方がいいだろう。 | |
749 | |
750 __ 例題 | |
751 cvs firefly:Game_project/student/master/gongo/Renew | |
752 | |
753 にあります。 | |
754 もうちょいちゃんとした例題が欲しいところです。 | |
755 | |
756 | |
757 __ 直したいところ (1) | |
758 | |
759 現在、Tc を管理する構造体として、TaskGroup を使ってます | |
760 | |
761 class TaskGroup { | |
762 unsigned int command; // T1 が PPE に送るコマンド | |
763 __gnu_cxx::slist<int> group; // Tc がある Linked List | |
764 | |
765 // function は省略 | |
766 }; | |
767 | |
768 slist じゃなくて、TaskQueue みたいに自分で作っても良かったんだけど。 | |
769 group.empty() == true になったら、command を PPE に送るって感じです。 | |
770 | |
771 で、slist が持つデータが TaskPtr じゃなくて int の理由。 | |
772 まあいろいろあるんだけど(何)、アドレスが重複してしまうことです。 | |
773 最初は、create_task で得られた TaskPtr をキーとして使うつもりだったけど | |
774 その TaskPtr は TaskList から取った物で (&list->takss[index] みたいな) | |
775 なんでそれじゃだめなのか。buff_taskList[2] (Scheduler.cpp 参照) を | |
776 使うと、交互に使用するのでアドレスは被る。 | |
777 新たに allocate すれば問題は無いが (t1とする)、SPE の LS の問題で | |
778 使わなくなった TaskList は free していかないといけない。 | |
779 で、free -> 再び allocate したとき (t2とする)、t1 と t2 の | |
780 アドレスが被ることがあった。当然 TaskPtr も被ると。 | |
781 だから、アドレスではなく、TaskGorup が持つ | |
782 unsigned int cur_id を使う事にしました。 | |
783 | |
784 なんかここまで自分で書いてて、 | |
785 なんで出来ないのかまだわからんくなってきた。 | |
786 | |
787 ので試しに戻してみたら * で * き * ま * し * た * | |
788 わけわからん。まあ勘違いだったのか、いろいろ別のところを直してるうちに | |
789 知らず知らずミスってたところも治ってたのか。まあいいか。 | |
790 | |
791 と思っていろいろ試したらまた動かなくなった。。もうだめぽ | |
792 とりあえず、また unsigned int に戻しました。 | |
793 今のところ、0 <= cur_id <= 0xffff (65535) の範囲のキーを使うように。 | |
794 | |
795 | |
796 __ 直したいところ (2) | |
797 if 文が多い。 | |
798 今は、「通常の Task」「タスク内で生成されたタスク」で挙動が違います。 | |
799 例えば | |
800 | |
801 - SPE で allocate されたデータを使うので、通常 DMA を使うところは | |
802 アドレス参照や memcpy を使う | |
803 - TaskGroup を、上記の Tc や Tcc へ引き継がせるところ | |
804 | |
805 なので、flag_renewTask とかいう変数で、ほぼ if 文 で書いてます。 | |
806 SPE でこの書き方はかなりまずい気がします。良い書き方はないものか。。。 | |
807 「通常の(ry」「タスク内(ry」で新たにインスタンスを作るってのも | |
808 考えはしましたが (SchedTask = 通常、SchedRenewTask = タスク内(ry とか) | |
809 これだと ユーザー側も この二つを選んでやることになります。 | |
810 「このタスクは SchedRenewTask 、このタスクは通常」とかやるのは | |
811 かなりめんどくさいと思う。だからライブラリ側で分けるべきか。。。 | |
812 多重継承とかってこんなとき役に立つん? | |
813 | |
814 | |
815 2008-07-03 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
816 | |
817 * TODO: | |
818 - add_param で渡せるパラメータの数を増やす。15もあればいいんじゃね? | |
819 - 今の実装では、 | |
820 | |
821 1. PPE でタスク(T1)が生成される | |
822 2. SPE で T1 が実行される | |
823 3. T1 が終わった事を PPE に mailbox で送る | |
824 送る情報は T1 自身。(PPE で生成された時のアドレス) | |
825 | |
826 なわけです。しかし、もし T1 から新たにタスクが生成された時はどうするか | |
827 仮に T1 から T2, T3, T4 が作られたとする。 | |
828 このとき、 | |
829 | |
830 1. T1 が終わった時点で、T1 から終了コマンドを送る | |
831 2. T1 だけでなく、T1 内で作られた T2, T3, T4 が終わってから | |
832 終了コマンドを送る | |
833 | |
834 の二つが考えられる。 | |
835 PPE 側では T1 しか認識していないため、この判定は SPE 内でやることになる | |
836 必要な処理かと言われると微妙だが、欲しくなるのは間違いない。 | |
837 つーことで今これを実装中です。 | |
838 | |
839 | |
840 * tag: v20080703 | |
841 - タスクに 32 bits パラメータを渡す add_param を実装(現在は3個まで) | |
842 - SPE 内部でタスク生成ができるようになった | |
843 | |
844 * add (API): SPE内部での create_task | |
845 今まで、SPE ではタスクを生成する事は出来ず、 | |
846 PPE から送られてくるタスクを実行するだけでした。 | |
847 それだと不便だってことで SPE 内部でもできるようにしました。 | |
848 方法はPPEでやるのと同じく | |
849 | |
850 task = create_task(TASK_EXEC); | |
851 task->add_inData(buff, sizeof(Buff)); | |
852 task->add_param(data); | |
853 | |
854 みたいな感じでいいです。 | |
855 spawn() や wait_for() は実装していません。 | |
856 SPE 内部で生成するタスク同士で依存関係作るのが | |
857 結構めんどくさいからです。spawn() も、しなくても勝手に実行します。 | |
858 PPE とそろえる意味で作ってもいいんだけどね。 | |
859 そのためには SPE にも TaskManager が必要になってくるなー。 | |
860 | |
861 | |
862 2008-06-24 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
863 | |
864 * add (API): add_param, get_param | |
865 DMA で送れないけど、必要になってくる 4 バイトの情報があるとして | |
866 それは今までは | |
867 | |
868 add_inData(param, 0); | |
869 | |
870 とかして、「サイズ == 0 なら 32 bit のデータ」としていたけど | |
871 それは余りにも変なので(関数の意味的にもおかしい)ので、 | |
872 | |
873 add_param(parameter); | |
874 | |
875 ってのを追加しました。タスク側では | |
876 | |
877 get_param(index); | |
878 | |
879 とかします。index は、add_param を呼び出した順番で決まります | |
880 | |
881 add_param(x); | |
882 add_param(y); | |
883 add_param(z); | |
884 | |
885 とあるとき、タスク側では | |
886 | |
887 int x = get_param(0); | |
888 int z = get_param(2); | |
889 | |
890 とします。 | |
891 今のところ parameter は 3つしか送れないことになってますが | |
892 後ほど、上限をあげます。15くらいあれば余裕だと思うんだがどうだい? | |
893 今は、SPE でのタスクの生成のルーチンを書くために、最低限な部分だけ | |
894 ってことで 3 つにしてます。それが出来次第、これもやります。 | |
895 | |
896 | |
897 2008-06-12 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
898 | |
899 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::set_runTaskList): | |
900 アホなミス(ry | |
901 | |
902 「list が持つ TASK_MAX_SIZE を超えると、次の list へ next を」っていう | |
903 前回直したところがまたミスっててだな。 | |
904 簡単に言うと | |
905 | |
906 TaskPtr task = &list[list->length++]; | |
907 [task の初期化] | |
908 | |
909 if (list->length > TASK_MAX_SIZE) { | |
910 [newList 生成] | |
911 newList = append(newList, topList[speid]); | |
912 topList[speid] = newList; | |
913 } | |
914 | |
915 ってやってたわけ。これだと、toplist[speid] に | |
916 length = 0 の list が来る可能性があると。 | |
917 で、spe に TaskList を送る条件は | |
918 | |
919 1. taskList[speid]->length >= 1 | |
920 2. speid が次の TaskList を待っている状態 | |
921 | |
922 で、1 の条件に触れてしまい、TaskList が送られなくなって | |
923 プログラムが終了しないと。アホですね〜 | |
924 上の if 文を &list[list->length++]; の前に持って行くだけでおk。 | |
925 | |
926 2008-06-10 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
927 | |
928 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::set_runTaskList): | |
929 アホなミスしてました。 | |
930 list が持つ TASK_MAX_SIZE を超えると、次の list へ | |
931 next を繋げるはずなんだけど、speTaskList_bg[speid] とか読む時に | |
932 ちゃんと繋げられてなかったというかなんというか。 | |
933 簡単に言うと、タスク多くなると落ち(ry | |
934 | |
935 * add (API): set_post | |
936 | |
937 create_task(id, 0); | |
938 | |
939 とかわざわざ 0 付けるのもアレなので、もうそれように | |
940 | |
941 task->set_post(func) | |
942 | |
943 を追加しました。func は void (*func)(void) です。 | |
944 せっかくだから、引数に void* とか付けてもいいんじゃないかと。 | |
945 | |
946 | |
947 * fix (API): ListDMA API | |
948 タスク側で、ListDMA で指定したデータの取り方 | |
949 | |
950 run(rbuf, wbuf) として | |
951 | |
952 // index は add_inData や add_outData で指定した(順番-1) | |
953 get_input(rbuf, index); | |
954 get_input(wbuf, index); | |
955 | |
956 返り値は void* なので、malloc っぽくキャストしてください。 | |
957 あと、4バイト以下のデータを送りたい場合、main で | |
958 | |
959 add_inData(data, 0) | |
960 | |
961 と、アドレスは送りたいデータを則値で、サイズは 0 で指定するとおk。 | |
962 get_input で int なりなんなりでキャストすればいいじゃない! | |
963 例題は | |
964 | |
965 Game_project/student/master/gongo/arr_cal | |
966 | |
967 で複数データ扱ってたり4バイト送ってたりしてます。 | |
968 | |
969 | |
970 * tag: v20080610 | |
971 前回との違いは | |
972 | |
973 - ListDMA の導入 | |
974 - 凡ミスfix | |
975 | |
976 とかかな。何気にここには ListDMA の API 書いてなかったな。 | |
977 | |
978 - task->add_inData(addr, size); // input | |
979 - task->add_outData(addr, size); // output | |
980 | |
981 これで Input/Output のデータ領域を指定可能。複数できます。 | |
982 詳しくはいずれドキュメントに書く予定だが、 | |
983 | |
984 - addr は 16 バイトアライメントに取れてないと行けない | |
985 - size は 16 バイト倍数 | |
986 | |
987 ってのが最低条件。 | |
988 16 バイト未満のデータを送りたいとき(整数を2,3個とか)は考え中。 | |
989 addr に直接渡すって手法はできるとわかってるので、それでもいいかな。 | |
990 まあいろいろ問題はありますが、少しはできたんじゃないかな。 | |
991 | |
992 次からは SPE 内でのタスク生成(再起動?)を書く予定 | |
993 | |
994 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::set_runTaskList): | |
995 if (speid > machineNum) { | |
996 speid %= MAX_USE_SPE_NUM; | |
997 } | |
998 | |
999 から | |
1000 | |
1001 if (speid >= machineNum) { | |
1002 speid %= machineNum; | |
1003 } | |
1004 | |
1005 に。なんという凡ミス | |
1006 | |
1007 * Cell/spe/CellDmaManager.cpp (CellDmaManager::dma_loadList): fix | |
1008 ListData が持つ ListElement は | |
1009 | |
1010 class ListElement { | |
1011 public: | |
1012 int size; | |
1013 unsigned int addr; | |
1014 }; | |
1015 | |
1016 というデータ構造なわけだが、これは、spu_mfcio.h が持っていて | |
1017 且つ List DMA で使用される | |
1018 | |
1019 typedef struct mfc_list_element { | |
1020 uint64_t notify : 1; /** Stall-and-notify bit */ | |
1021 uint64_t reserved : 16; | |
1022 uint64_t size : 15; /** Transfer size */ | |
1023 uint64_t eal : 32; /** Lower word of effective address */ | |
1024 } mfc_list_element_t; | |
1025 | |
1026 と同じである。notify と reserved は 0 となる (ストールは今は | |
1027 考えていない)ので、結局は uint が 2 つの 8 バイト のデータ構造であれば | |
1028 そのまま mfc_getl とか mfc_putl に遅れるわけである。 | |
1029 今までは mfc_list_element_t 構造体に for 文でいちいち代入してたが | |
1030 まあそれはなくなったっつーことで。dma_storeList もね。 | |
1031 | |
1032 | |
1033 2008-05-30 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1034 | |
1035 * change (API): TaskManager Memory Allocate | |
1036 manager->cerium_malloc(&buff, DEFAULT_ALIGNMENT, sizeof(Data)) | |
1037 | |
1038 から | |
1039 | |
1040 buff = (Data*)manager->malloc(sizeof(Data)); | |
1041 | |
1042 に変更しました。 | |
1043 alignment の指定は全て TaskManager に埋め込んであります。 | |
1044 記述は TaskManager.h に書いてあります。 | |
1045 | |
1046 void* TaskManager::malloc(int size) { | |
1047 return m_impl->allocate(DEFAULT_ALIGNMENT, size); | |
1048 } | |
1049 | |
1050 2008-05-29 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1051 | |
1052 * thinking: List DMA (4) | |
1053 Cell 版でも動いたのを確認。今、Cell 版で List DMA が動く条件は | |
1054 | |
1055 1. List の各要素の転送サイズが 16 バイト倍数でなければならない | |
1056 2. List の各要素の転送するデータのアドレスのアライメントを保証(16or128 | |
1057 | |
1058 2に関しては Cell の仕様なんでまあいいんだけど、 | |
1059 1は、ドキュメント見る分には | |
1060 | |
1061 - Cell Broadband Engine アーキテクチャ version 1.01 より | |
1062 - 7.5.3 get list | |
1063 > リスト・サイズ・パラメータは、このDMAコマンドの場合は | |
1064 > 8バイトの倍数でなければならず、また、リスト・アドレス・パラメータは、 | |
1065 > ローカルストレージの8バイト境界にアラインされなければなりません。 | |
1066 | |
1067 って書いてるんだよな。int が 10 個の配列(40バイト) を送っても | |
1068 見事に弾かれたんだよな。おのれバスエラーめ! | |
1069 とりあえず、上の条件を満たせば行けました。 | |
1070 送るデータのアロケートは | |
1071 | |
1072 TaskManager::cerium_allocate(void **buff, int align, int size); | |
1073 | |
1074 ってのを作りました。使い方は別項目で。だいたい posix_memalign 準拠。 | |
1075 | |
1076 動くのはいいんだけど、これだとユーザに全部任せる事になります。 | |
1077 特に、配列をアロケートした後、その途中の部分をリストに入れたい時。 | |
1078 その配列の要素のサイズが16倍数じゃないとそこでエラーがでると。 | |
1079 それをユーザに全部任せるのは、まあいけないこともないけどさ。。。 | |
1080 | |
1081 | |
1082 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::mail_check): fix | |
1083 CellTaskManager は FifoTaskManager のオブジェクトを | |
1084 ppeManager という変数で持っていて、作業を別々に行っているわけで。 | |
1085 だけど両方のオブジェクトがもつ waitTaskQueue は同じじゃないと | |
1086 ならないので、最初は TaskQueuePtr * とかで渡して | |
1087 共有してたわけだけど、よくよく考えると、 | |
1088 | |
1089 - waitTaskQueue に task が append される時 | |
1090 CellTaskManager->append_waitTask() | |
1091 | |
1092 - waitTaskQueue から task が remove されるとき(依存満たした時とか) | |
1093 FifoTaskManagerImpl->mail_check() 及び | |
1094 CellTaskManagerImpl->mail_check() です。 | |
1095 | |
1096 つまり、waitTaskQueue が共有されるのは mail_check だけなので、 | |
1097 CellTaskManagerImpl の mail_check で | |
1098 | |
1099 ppeManager->mail_check(mail_list, &waitTaskQueue) | |
1100 | |
1101 として、ここで waitTaskQueue を参照渡ししてます。 | |
1102 ppeManager->mail_check で waitTaskQueue の整理が終わって | |
1103 戻ってくる事には waitTaskQueue が更新されていると。 | |
1104 | |
1105 なんか文章がおかしいですね。気になる人は俺に直でお願いします。 | |
1106 要するに、ppe と spe のそれぞれの TaskManagerImpl で | |
1107 waitTaskQueue の共有が上手くいったというわけです。 | |
1108 | |
1109 | |
1110 2008-05-24 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1111 | |
1112 * thinking: List DMA (3) | |
1113 現在実装中。Fifo 版では動いている模様。 | |
1114 問題は Cell だよなー。考えないと行けない事がいくつか | |
1115 | |
1116 - Input/Output データはアライメントされている? | |
1117 アライメントされていなくても、こっちでアドレスずらして | |
1118 DMAしてずらして run() に渡して〜とかもできるんだけど | |
1119 かなりめんどくさい。それに、In ならともかく、 | |
1120 Out は変な領域に書き込みそうなので無理そう。 | |
1121 これはもうユーザが、送るデータはすべて | |
1122 Cerium_malloc 的なものを通したものだけ、っていう | |
1123 制約にした方がいいかもしれない。てかそうなんだっけ。 | |
1124 | |
1125 - 配列中のデータの指定 | |
1126 上の項目と少し関連があるんだが、例えば | |
1127 | |
1128 int data[100]; // アライメントは取れてるとする | |
1129 | |
1130 ってのがあって、そのなかの data[0]〜data[49]、 | |
1131 data[50] 〜 最後まで送りたいとする。 | |
1132 最初のやつは &data[0] のアドレスは 16 bytes アライメントだけど、 | |
1133 &data[50] では、sizeof(int)*50 = おそらく 200 ずれて | |
1134 16 bytes アライメントではなくなると。これだと DMA できない。 | |
1135 ユーザがそこまで考えて、例えば data[32] から送る、とかでもいいけど。 | |
1136 ライブラリ側で、少しは融通効くようにすべきかな。 | |
1137 やるなら、アドレスずらして取って来て、ユーザが見るデータは | |
1138 そのずらした分戻してから見せるって感じ。変な説明だが。 | |
1139 | |
1140 うーん。今はとりあえず全てアライメント大丈夫な方向でやってみるか。 | |
1141 | |
1142 | |
1143 2008-05-23 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1144 | |
1145 * Cell/SpeThreads.cpp (SpeThreads::init): スレッドの生成 | |
1146 今まで作られてたスレッドは | |
1147 | |
1148 - spe_context_run を実行するだけのスレッド (spe_thread_run) | |
1149 - 上のスレッドを呼び出し、終了を待つスレッド (frontend_thread_run) | |
1150 | |
1151 2番目に何の意味があるのかということだが、 | |
1152 SPE 毎にスレッドを立ち上げておいて、 | |
1153 それぞれのSPEからのメールは、その担当するスレッドが見る、 | |
1154 って構想で作っていました。だけど、今は mailbox の扱いは | |
1155 Cell/CellTaskManagerImpl::mail_check で行っているため | |
1156 わざわざ2番目のスレッドを作る必要がなくなりました。 | |
1157 つーことで、frontend_thread_run ではなく、 | |
1158 最初から spe_thread_run を起動すればおkとなりました。 | |
1159 | |
1160 * Cell/SpeThreads.cpp (SpeThreads::get_mail): if 文排除 | |
1161 今までは | |
1162 | |
1163 if (spe_out_mbox_read(spe_ctx[speid], &ret, 1) < 0) { | |
1164 return ret; | |
1165 else | |
1166 return -1; | |
1167 | |
1168 とやっていた。これは | |
1169 | |
1170 - データを読めたらそれ(ret)を返す | |
1171 - データが無かったら -1 を返す | |
1172 | |
1173 ってことだったんだが、よくよく考えると、spe_out_mbox_read() は | |
1174 データがなかった場合 ret の値を変えないので、最初に | |
1175 | |
1176 unsigned int ret = (unsigned int)-1; | |
1177 | |
1178 としておけば、最終的に if 文無しの | |
1179 | |
1180 spe_out_mbox_read(spe_ctx[speid], &ret, 1); | |
1181 return ret; | |
1182 | |
1183 だけで済むわけだ。 | |
1184 | |
1185 2008-05-22 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1186 | |
1187 * thinking: List DMA (2) | |
1188 MFC List DMA read の場合は(少なくともPPEでcreate_taskする時は) | |
1189 read size が決まっているので無問題。 | |
1190 しかし、MFC List DMA write の場合。同じタスクでも | |
1191 違うサイズを出力するということはありえるので問題。 | |
1192 今までも、write の場合は task->run() の返す値が write size として | |
1193 使う事にしていた。List DMA write の場合は、おそらく | |
1194 | |
1195 - task->run() 内で write 用の List DMA 構造体を作って Scheduler に | |
1196 渡して、task->write() でやってもらう | |
1197 | |
1198 って感じ? でも(上の手法に限らず)、write のサイズが決まってないと | |
1199 write 用バッファを生成しておく事ができないので | |
1200 書き込めない or あらかじめ多めに取っておくってことが必要になる。 | |
1201 後者は SPE には痛手(昔は強制16KB確保とかやってたな)なので微妙。 | |
1202 前者は論外だろう。 | |
1203 | |
1204 うーん、どうすっかな。Single DMA write の頃からこれは問題であって。 | |
1205 最悪、ユーザが「write のサイズが変動しないようなタスクにする」とか? | |
1206 | |
1207 * thinking: List DMA | |
1208 | |
1209 構想としては以下のような考え。 | |
1210 | |
1211 class Task { | |
1212 int cmd; | |
1213 DataListDMA *rlist; | |
1214 DataListDMA *wlist; | |
1215 }; | |
1216 | |
1217 class DataListDMA { | |
1218 int length; // リストの数 | |
1219 unsigned int addr[128]; // アドレス | |
1220 int size[128]; // そのアドレスから取得するデータのサイズ | |
1221 }; | |
1222 | |
1223 128 という数字は、一つのタスクが持てるリストの合計サイズを | |
1224 1KB (= 1024B) にしようってことで 4*128+4*128 = 1024 としました。 | |
1225 ListDMA を使う流れとしては | |
1226 | |
1227 1. Scheduler から cmd にそった Task を生成する | |
1228 2. Task のコンストラクタ(もしくは Task を生成する implement 内 )で | |
1229 task->rlist, task->wlist を DMA read しておく (ここは通常のDMA) | |
1230 3. task->read() で MFC List DMA で List を読む | |
1231 | |
1232 DataListDMA->length に関しては、Task の中に入れるのも有りかと思う。 | |
1233 その場合は、2 の DMA read で、わざわざ 1KB 全部読む必要は無くなる。 | |
1234 | |
1235 | |
1236 * tag: v20080522 | |
1237 - PPE 側のタスクも SPE と同じく、クラスオブジェクトとして登録 | |
1238 - PPE、SPE 側の TaskManagerImpl を整理。見やすくなったと思われ | |
1239 | |
1240 こんなところかなー。 | |
1241 テストプログラムは | |
1242 | |
1243 Game_project/student/master/gongo/hello | |
1244 | |
1245 にあります。DMA の例題まだだったぜHAHAHA | |
1246 ここからは List DMA の処理を入れて行きたいと思います。 | |
1247 | |
1248 現在の simple_render のバージョンは | |
1249 PPE のタスクが関数ベースだった頃のなのでそのままでは動きません。 | |
1250 List DMA ができるか、気晴らしに描き直すと思います。 | |
1251 | |
1252 * Task 定義について | |
1253 PPE も C++ のクラスオブジェクトとしてタスクを定義するようにしました。 | |
1254 ちゃんとした API を考えたら改めて書きます。 | |
1255 | |
1256 * メールチェックから次のタスクリスト生成までの流れの変更 | |
1257 今までの FifoTaskManagerImpl の mail_check では | |
1258 | |
1259 1. mail_check | |
1260 1.1 check_task_finish | |
1261 1.1.1 notify_wait_taskQueue | |
1262 1.1.1.1 append_activeTask (依存満たしたタスクを) | |
1263 1.2 get_runTaskList | |
1264 | |
1265 と、全て mail_check の中で終わってたんですが、これを | |
1266 | |
1267 1. mail_check | |
1268 1.1 check_task_finish | |
1269 1.1.1 notify_task_finish | |
1270 2. wakeup_waitTask (つまり append_activeTask) | |
1271 3. get_runTaskList | |
1272 | |
1273 というように分割しました。 | |
1274 おかげで CellTaskManagerImpl の mail_check もすっきり。 | |
1275 | |
1276 2008-05-13 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1277 | |
1278 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::set_task): | |
1279 // set_task って名前やめね? | |
1280 | |
1281 どの SPE に振るかって判定を少し変更。 | |
1282 cur_anySpeid の宣言場所のコメントにもあるけど、 | |
1283 これはインクリメントじゃなくて乱数の方が | |
1284 より SPE_ANY っぽいのか。むしろ「仕事してない方に割り振る」ってのが | |
1285 SPE_ANY の役目な気がするな。ウーム。。。 | |
1286 | |
1287 2008-05-05 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1288 | |
1289 * Cell/CellTaskManagerImpl.cpp (CellTaskManagerImpl::mail_check): | |
1290 PPE には実行するタスクが一つも無い時の動作がおかしかった。 | |
1291 要するに、 | |
1292 | |
1293 PPE で実行するタスクは全て SPE で実行中のタスク待ち | |
1294 | |
1295 って時。。。よけいわからなくなったな。 | |
1296 まあなんだ、今まで 必ずタスクが PPE and SPE にあったんだけど | |
1297 PPE or SPE ってか、どっちか片方でしか動いてない状況だと | |
1298 終了判定というか、それがおかしかったっぽい。 | |
1299 | |
1300 Hello World でのタスクは | |
1301 | |
1302 1. "Hello World!!" と表示するタスク (2.) を発行するタスク | |
1303 2. 表示するタスク | |
1304 3. 2 が全て終わったら実行される、最後のタスク(番兵的な | |
1305 | |
1306 この時、(2) が SPE だけで実行されてると、 | |
1307 (2) の終了を待つ (3) の判定?というか、それがおかしい | |
1308 | |
1309 | |
1310 もう眠くてわけわからん。 | |
1311 一応動いたんだけど、やはり描き直します。 | |
1312 気持ち悪いほどやっつけな書き方してるので。これはきもい。。。 | |
1313 | |
1314 2008-03-09 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1315 | |
1316 * memo: pthread_cond_wait | |
1317 この ChangeLog に書くものでもないが、まあメモ。 | |
1318 | |
1319 セマフォの P 動作は、基本的に | |
1320 | |
1321 --------------------- | |
1322 pthread_mutex_lock(&sem->mutex); | |
1323 | |
1324 while(sem->value == 0) { // 資源が無い | |
1325 // 条件付き変数に自分を登録して、ロックを解放して、他の | |
1326 // プロセスが資源を解放してくれるのを待つ | |
1327 pthread_cond_wait(&sem->cond,&sem->mutex); | |
1328 } | |
1329 // 自分の分の資源があったので、それを確保する */ | |
1330 sem->value--; | |
1331 // ロックを解放する | |
1332 pthread_mutex_unlock(&sem->mutex); | |
1333 ---------------------- | |
1334 | |
1335 こんな感じ。でコメントにもあるように、 | |
1336 pthread_cond_wait では、wait の前に unlock する。 | |
1337 これがよくわかってなくて、「while の外で lock してるのに | |
1338 「なんで他のプロセスが lock できるんだろう。」と。 | |
1339 man 見ろよと思った。てか先生のページのコメントに書いてるよ! | |
1340 | |
1341 | |
1342 2008-03-08 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1343 | |
1344 * memo: mailbox read の blocking/non-blocking | |
1345 spe_out_mbox_read は non-blocking API なので、 | |
1346 これをぐるぐる回すと busy-wait になるので、 | |
1347 今の所 ppe 側の Scheduler がトップに戻る?時にメール確認する。 | |
1348 で、spe_out_intr_mbox_read は blocking API 。 | |
1349 spe_out_mbox_read との記述の違いは、予め | |
1350 spe_event_handler_register で SPE_EVENT_OUT_INTR_MBOX を | |
1351 登録しておく。spe 側では、 | |
1352 | |
1353 spu_writech(SPU_WrOutMbox, data) | |
1354 | |
1355 じゃなくて | |
1356 | |
1357 spu_writech(SPU_WrOutIntrMbox, data) | |
1358 | |
1359 を使う必要がある。 | |
1360 両者の mailbox read の速度を調べてみたけど、そんなに違いは感じない。 | |
1361 まあベンチマークの取り方がへぼいせいかもしれないけど。 | |
1362 ってことで、こっちの intr の方がいいんじゃないかと思う。 | |
1363 これと セマフォを組み合わせて mail の処理は簡単になると思う。 | |
1364 セマフォの処理が重いって話もあるが、どうなんだろうね。 | |
1365 | |
1366 * Test/simple_render/task/create_span.cpp (half_triangle): fix | |
1367 画面外の span を描画しようとして落ちるので、それの修正。 | |
1368 polygon->span の時点で外してるけど、span を外すより | |
1369 Polygon の時点で修正するべきかな? | |
1370 | |
1371 * kernel/ppe/TaskManagerImpl.cpp (TaskManagerImpl::set_task): fix | |
1372 返す TaskList が、mainTaskList の最後尾になってた。 | |
1373 ってことで、TaskList のトップである bufferManager->mainTaskList を。 | |
1374 | |
1375 * kernel/ppe/BufferManager.cpp (BufferManager::clear_taskList): fix | |
1376 mainTaskList->length はクリアしてるのに、 | |
1377 mainTaskList->next をクリアし忘れてた。 | |
1378 だから空の TaskList が送られてたのか・・・ちくしょう! | |
1379 | |
1380 2008-03-07 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1381 | |
1382 * bug-fix (Test/simple_render): y座標の移動方向 | |
1383 (1) で、書き込む時に | |
1384 | |
1385 y = height - y | |
1386 | |
1387 としていた。千秋に聞いてみると、 | |
1388 | |
1389 「ポリゴンの y を増やす(+)と、画面上に進むようにした」 | |
1390 | |
1391 だそうです。なるほどねー。ってことで(2)でもやったら上に進んだよ。 | |
1392 | |
1393 しかし、ゲーム的には上が + の方がわかりやすいかもしれんが、 | |
1394 プログラミング的には、framebuffer ベースでやるので、 | |
1395 下にいくと y++ ってほうが作りやすいかなーと思いつつ。どっちがいいかね | |
1396 | |
1397 * bug (Test/simple_render): y座標の移動方向 | |
1398 Viewer::run_draw で、従来の、SpanPack をそのまま描画する方法(1)と、 | |
1399 SPE に渡すように、8分割したものとして描画する方法(2)で、 | |
1400 それぞれの y に +0.5 とかしたら、移動する方向が違う。 | |
1401 (1)では上、(2)では下へ行く。 | |
1402 送られてくる span には違いが見られず、 | |
1403 x 方向や 回転は問題ないので、おそらく draw 時の y の計算のバグだろう。 | |
1404 | |
1405 1: polygon.cpp Polygon::draw(SPANPACK); | |
1406 2: task/span_pack_draw.cpp run(); | |
1407 | |
1408 * Test/simple_render/spe/SpuDraw.cpp: ↓の続きの解決 | |
1409 render_y &= ~7 | |
1410 | |
1411 これでおkでした。先生ありがとうございます。 | |
1412 今はマクロとして | |
1413 | |
1414 #define YTOP(y) (y & ~7) | |
1415 | |
1416 ってやってますわ。 | |
1417 | |
1418 2008-03-05 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1419 | |
1420 * memo: MFC List DMA の element の最大値 | |
1421 「Cell Broadband Engine Architecture Version 1.02」 より | |
1422 | |
1423 P.55 | |
1424 The maximum number of elements is 2048. | |
1425 Each element describes a transfer of up to 16 KB. | |
1426 | |
1427 ってことらしいです。一度の転送での制限は普通のDMAと変わらず16KB。 | |
1428 mfc_list_element_t は 2048 個まで設定できるってことか。 | |
1429 テクスチャのロードで、分割しないなら MFC List DMA を使うことになるが、 | |
1430 2048 個もあれば充分? | |
1431 | |
1432 | |
1433 * Test/simple_render/spe/SpuDraw.cpp: ↓の続き | |
1434 と思ったけど、やっぱりずれるなあ。うーむ。 | |
1435 とりあえず今は | |
1436 | |
1437 if (render_y < 0) { | |
1438 int tmpy = render_y%8; | |
1439 render_y -= tmpy + (tmpy != 0)*8; | |
1440 } else { | |
1441 render_y -= (render_y%8); | |
1442 } | |
1443 render_y += 1080/2; | |
1444 | |
1445 で落ち着くことに。うーむ。 | |
1446 もっと良い計算を考えるよりは span の生成時で | |
1447 いろいろやるほうがいいのかなー | |
1448 | |
1449 2008-03-04 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1450 | |
1451 * Test/simple_render/spe/SpuDraw.cpp: ↓の続き | |
1452 よくよく考えてだな。。。マイナスが気になるなら | |
1453 | |
1454 if (render_y < 0) { | |
1455 int tmpy = render_y%8; | |
1456 render_y -= tmpy + (tmpy != 0)*8; | |
1457 } else { | |
1458 render_y -= (render_y%8); | |
1459 } | |
1460 render_y += 1080/2; | |
1461 | |
1462 じゃなくて | |
1463 | |
1464 render_y += 1080/2; | |
1465 render_y -= (render_y%8); | |
1466 | |
1467 これでよくね?ってか元々そのための 1080/2 だった気が。。。 | |
1468 | |
1469 * Test/simple_render/spe/SpuDraw.cpp: render_y の計算の修正 | |
1470 sp->span[0].y (SpanPack に格納されてる最初の Span の y 座標) から | |
1471 この SpanPack が描画する範囲の一番上の y 座標を調べる。 | |
1472 | |
1473 どういうことかっていうと、例えば SpanPack に入ってる Span が持つ | |
1474 y 座標が 1 ~ 8 の時 | |
1475 | |
1476 1 ----- | |
1477 -- | |
1478 -------- | |
1479 ---- | |
1480 --------- | |
1481 8 -- | |
1482 | |
1483 '-' は描画していると思ってください。 | |
1484 この場合は、y = 1 がこの SpanPack の一番上、基準となる 座標ってこと。 | |
1485 framebuffer に書き込むとき、y = 1 から順々に書いて行きます。 | |
1486 | |
1487 で、sp->span[0].y ってのが、その基準となる y である保証が無いので、 | |
1488 sp->span[i].y 、つまりどの y からでも、基準となる y を求める | |
1489 必要がある。その計算をミスってました。 | |
1490 | |
1491 1 ////////// | |
1492 <- なぜか書き込まれていない | |
1493 ////////// | |
1494 ////////// | |
1495 | |
1496 みたいに、歯抜けした部分があったので、いろいろ調べてみたら | |
1497 この render_y がずれてるってことが判明しました。 | |
1498 今までは | |
1499 | |
1500 render_y = sp->span[0].y; | |
1501 render_y += 1080/2; | |
1502 render_y = (render_y/8)*8; | |
1503 | |
1504 ってことしてたんだけど、これだと sp->span[0].y が マイナスのとき | |
1505 ずれることが判明。なので | |
1506 | |
1507 if (render_y < 0) { | |
1508 int tmpy = render_y%8; | |
1509 render_y -= tmpy + (tmpy != 0)*8; | |
1510 } else { | |
1511 render_y -= (render_y%8); | |
1512 } | |
1513 render_y += 1080/2; | |
1514 | |
1515 こうするとできました。。。が、直したい。 | |
1516 もう少し奇麗に描けると思うんだけどなー。if 文ぐらいは外したい | |
1517 | |
104 | 1518 2008-03-03 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
1519 | |
109 | 1520 * memo: 最適化の結果 |
1521 ppe/spe ともに最適化なしの場合 | |
104 | 1522 263.444 FPS |
1523 | |
109 | 1524 ppe だけ -O9 で最適化 |
104 | 1525 317.425 FPS |
1526 | |
109 | 1527 spe だけ -O9 で最適化 |
104 | 1528 812.539 FPS |
109 | 1529 |
1530 ppe/spe ともに -O9 で最適化 | |
1531 1610.58 FPS (吹いた | |
104 | 1532 |
1533 | |
109 | 1534 最初、ダブル最適化の画像を見た時の |
1535 あまりの早さにびびった。 | |
1536 逆に「こ、これはバグか!?」と思った | |
104 | 1537 |
109 | 1538 |
103 | 1539 2008-02-28 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> |
1540 | |
1541 * kernel/ppe/BufferManager.cpp: remove_taskQueue_all() | |
109 | 1542 taskQueue の create と free が釣り合って無くて、 |
1543 queue が足りなくなる -> extend_pool -> 足りなく(ry | |
1544 ってのを繰り返してメモリ的なセグメンテーションフォルとが出て | |
1545 なんでかなと思ったら、task->wait_me を消去してなかった。 | |
1546 task->wait_i は notify(ry で削除されるんだけど、 | |
1547 task->wait_me は、notify(ry に渡した後ほったらかしだった。 | |
1548 ってことで、wait_me を全消しする関数を作りましたとさ。 | |
1549 気持ち速度が増した気がする。気ね。 | |
1550 | |
103 | 1551 |
1552 2008-02-17 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1553 | |
109 | 1554 * Todo: 悩んでる所 |
1555 | |
103 | 1556 |
1557 * fix: kernel/ppe/HTask.cpp | |
109 | 1558 今まで、manager->create_task で生成したタスクは |
103 | 1559 |
109 | 1560 - dependency の設定 |
1561 manager->set_task_depend(master, slave) // slave は master を待つ | |
103 | 1562 |
109 | 1563 - 実行キューへの追加 |
103 | 1564 manager->spawn_task(master); |
1565 manager->spawn_task(slave); | |
1566 | |
109 | 1567 と、manager を介してやっていました。 |
1568 まあそれでもいいんだけど、特に dependency の所は | |
1569 どっちがどっちを待つのかってのは、API見るだけじゃわからない。 | |
1570 そこで、Task (HTask のこと) に、上二つに対応するような | |
103 | 1571 |
109 | 1572 void set_depend(HTaskPtr) と void spawn(void) を追加しました。 |
103 | 1573 |
1574 - Usage | |
109 | 1575 slave->set_depend(master); // slave は master を待つ |
1576 slave->spawn(); // slave をキューへ追加 | |
103 | 1577 |
109 | 1578 結局は、それぞれの関数の中では、上の set_task_depend とかを |
1579 呼んでるんだけど、ユーザ側からするとこの方がわかりやすいと思います。 | |
103 | 1580 |
1581 2008-02-16 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1582 | |
1583 * tag: beta3 | |
109 | 1584 ダブルバッファリングを追加し、まあなんとか動いてるんじゃない?って |
1585 ところまでですが、所詮 Fifo バージョンなので、 | |
1586 そろそろ Cell を書き上げて、並列にちゃんと動いてるか確かめないとね | |
103 | 1587 |
1588 * add: kernel/ppe/DmaBuffer.cpp | |
109 | 1589 ダブルバッファリング用に作ったんだけど、 |
1590 せっかくなので、DMA は、このオブジェクト(が持つ二つの領域)でしか | |
1591 行えないようにする。ってのでどうでしょう。って話を先生としました。 | |
1592 並列処理だし、ダブルバッファリングがデフォでいいでしょう。 | |
1593 というか、したくなければ swap_buffer とかしなければおk。 | |
103 | 1594 |
1595 -Usage | |
1596 DmaBuffer *buffer = manager->allocate(sizeof(SceneGraphPack)); | |
1597 | |
109 | 1598 今までと違い、create_task の in_addr と out_addr には |
1599 DmaBuffer をいれてください。ユーザが自分で malloc/new したやつは | |
1600 エラーを出すようにしてる(seg faultだけどね!) | |
1601 汚いソースだが、実際に使ってる様子は Test/simple_render の | |
1602 viewer.cpp で使ってます。sgp_buff と pp_buff ってやつね。 | |
103 | 1603 |
109 | 1604 もうすこしユーザに優しいAPIを作りたい・・・ |
103 | 1605 |
1606 2008-02-11 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1607 | |
1608 * add: Test/simple_render | |
109 | 1609 chiaki の DataPack を使った Cube の表示プログラム。 |
1610 簡単に DataPack を TaskManager の scheduler (SpeManager) に渡して | |
1611 処理してコピーして、を繰り返してるだけなんだけど | |
1612 まあ動いてる気がするのでいいんじゃないでしょうか。 | |
103 | 1613 |
1614 | |
1615 2008-02-10 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1616 | |
1617 * tag: beta1 | |
109 | 1618 この状況だと、できることよりもできないことを書くべき?違うか。 |
103 | 1619 |
109 | 1620 - task (親) 中で task (子) を生成することはできない |
1621 正確には「生成はできる」だけど、その 子task が | |
1622 親task に依存している別の task を無視して動くので | |
1623 ちゃんとした結果にならないと。 | |
1624 8日の Todo にも書いてあるけど、今の実装では | |
1625 task が task を生成することを想定してない感じなので。 | |
1626 完全に spe 用にのみ狙いを絞った実装であって | |
1627 OS って言えない実装であるからして、書き直すの? | |
1628 全ての関数を task しようとするとこうなる訳で、 | |
1629 ある部分だけやるってのはまあできるんだろうけど、うーん。 | |
103 | 1630 |
109 | 1631 - chiaki の simple_render が動かない |
1632 (追記) 解決しました | |
1633 単に read/write buffer のサイズが足りないだけだった。アホスwww | |
1634 まあ辱めの為の下は残しておこう | |
103 | 1635 |
109 | 1636 まだ cvs に commit してないけど、chiaki が書いた、 |
1637 DataPack 対応の simple_render に TasKManager を組み込んでみた。 | |
1638 といっても、OSっぽく書いたんじゃなく、今は | |
1639 update_sgp と create_pp だけを task 化してみた。 | |
1640 でまあ動いてるような気はするけど、ものすっごい malloc 系の warning が。 | |
1641 時々長く動くよねみたいな感じになってしまっている。 | |
1642 TaskManager が悪いのか、simple_render が悪いのか。 | |
1643 この TaskManager、ある部分での malloc 系の問題に敏感だなあ。 | |
1644 まあそうでなかったらバグの探しようも無いし、良いっちゃー良いんだが。 | |
103 | 1645 |
1646 | |
1647 2008-02-08 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1648 | |
1649 * add: kernel/ppe/SymTable.cpp | |
109 | 1650 今まで func[] = {add, sum, ...} |
1651 とかやってかっこわるい言われまくってたので | |
1652 話し合いの通り Symbol Table みたいなものを作ることに | |
103 | 1653 |
109 | 1654 // 疑似コードね |
103 | 1655 struct sym_table { |
109 | 1656 char *sym; // シンボル |
1657 void *address; // シンボルが示すアドレス | |
103 | 1658 } sym_table[] = {{"Sum", &Sum} , {"Draw", &draw}}; |
1659 | |
1660 int fd = get_fd("Sum"); | |
1661 void *addr = get_address(fd); | |
1662 | |
109 | 1663 table には "Sum" と "Draw" っていう二つのシンボルが登録されている。 |
1664 例えば、ユーザ(カーネル?)が "Sum" ってシンボルにアクセスしたい場合、 | |
1665 まずは get_fd で "Sum" に対する、file descripter を返す。 | |
1666 ユーザは、その fd に従って get_address を取得することが出来る。 | |
1667 TaskManager 的な使い方をするなら | |
103 | 1668 |
109 | 1669 // 俺は今、Draw 関数を使うタスクを生成したい |
103 | 1670 int fd = manager->open("Draw"); |
1671 manager->create_task(fd, size, in, out, func); | |
109 | 1672 manager->open では get_fd と同じ使い方です。 |
103 | 1673 |
109 | 1674 まだ改良の余地ありそうですが、今は動いてるってことで。 |
103 | 1675 |
1676 | |
109 | 1677 - 補足 |
1678 なぜ file descripter と表すか | |
103 | 1679 |
109 | 1680 OS の昨日として、 fopen とかと同じ使い方もできるじゃない! |
103 | 1681 |
1682 | |
109 | 1683 * Todo: task が task を生成する際の処理 |
1684 今まで、 task が行う作業は、演算のみを行うような | |
1685 単純な実装に決め打ちされているわけです。 | |
1686 しかし、OS なんかだと、タスク中から別のタスクを生成するとか | |
1687 ありありだと思われる。てか今のテストプログラムでなった。 | |
103 | 1688 |
109 | 1689 Test/Sum にあるプログラムで使われるタスク |
103 | 1690 |
109 | 1691 - init2 // 貧相な名前ですまない |
1692 演算する数値とかバッファの初期化 | |
103 | 1693 |
1694 - sum1 | |
109 | 1695 ある範囲の整数 (i から i+16 とか) の総和 |
103 | 1696 |
1697 - sum2 | |
109 | 1698 sum1 で求められた、複数の範囲の総和を一つにまとめる |
1699 (ex. 複数の sum1 が 1->16, 17->32, 33->48 の総和を計算し、 | |
1700 sum2 で 上の3つの総和を計算する | |
1701 要は 1->48 の総和を分割するっていうプログラムね | |
103 | 1702 |
1703 - finish | |
109 | 1704 sum2 で求まった値を表示 |
103 | 1705 |
109 | 1706 この Sum というプログラム、というか OS と言おう。SumOS ね。 |
1707 SumOS は最初に TaskManager (所謂 kernel) を起動し、 | |
1708 init を起動する。init では、予め決められたタスクである | |
1709 init2 と finish の二つのタスクを create して登録する。 | |
1710 init2 と finish には依存関係がある (init2 が終わったら finish) | |
1711 init2 の中で、sum1 と sum2 というタスクが作られる。 | |
1712 sum1 と sum2 にも依存関係はある (sum1 が終わったら sum2) | |
103 | 1713 |
109 | 1714 今の実装だと、タスクが終了して初めて次のタスクへ行く。 |
1715 まあ当たり前なんだけど、例えばそのタスクの中で | |
1716 新たにタスクが作られた場合、そのタスクが終了するまでは | |
1717 実行されなくなってしまう。 | |
1718 でまあ、今は、manager->create_task される度に | |
1719 manager->run とかして、無理やり起動してる訳さ。 | |
1720 何が無理矢理かっていうと、scheduler の役目をしている | |
1721 SpeManager (これも名前変えないと) を2度呼び出してる訳。 | |
1722 つまり、タスク中でタスクを作る度に、SpeManager オブジェクトを | |
1723 new してるわけさ。いいのか?いや、動いてるけどね? | |
103 | 1724 |
109 | 1725 ちなみに、Cell version だと spe が勝手に取っていってくれるから |
1726 大丈夫かなと思いつつ、もし spe を1つしか使わない設定だったら微妙。 | |
103 | 1727 |
109 | 1728 要するに、タスク中でタスクが作られる場合の処理を考えないとね。 |
103 | 1729 |
1730 2008-02-07 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1731 | |
109 | 1732 * memo: プログラミングの姿勢 |
1733 scheduler とか、task の管理をする部分は | |
1734 kernel programing のつもりで、 | |
1735 example とか、task に割り当てる処理を決めたりする部分は | |
1736 user programing のつもりで。 | |
103 | 1737 |
109 | 1738 それぞれ違った視点で見る必要がある |
103 | 1739 |
109 | 1740 * memo: OS というもの |
1741 OS 起動の流れ | |
103 | 1742 |
109 | 1743 - PC の電源を入れる |
1744 - BIOS が立ち上がる (OpenFirmWare, EFI, BIOS) | |
1745 - 起動デバイスをチェック (優先度とか種類とか) | |
1746 - 起動デバイスから Boot loader を起動 | |
1747 + BIOS によって、認識できるファイルシステムが違う(だっけ?) | |
1748 + ファイルシステムのどこに Boot Loader があるか知っている | |
1749 + grub, grub2, lilo, kboot などがある | |
1750 - Boot Loader が kernel を起動 | |
1751 + ネットワークブートの場合、TCP/IP や | |
1752 ネットワークデバイス(イーサとか?)のドライバを持ってる必要がある | |
1753 - kernel は、最初に scheduler を起動する | |
1754 - scheduler の初期化 (init を呼ぶ?) | |
1755 - init では、事前?に設定されているスクリプトとかを呼ぶ | |
1756 + linux とかだと /etc/rc にあるやつを init が呼ぶ | |
1757 - login form が起動 | |
103 | 1758 |
109 | 1759 補足 こっからユーザ |
1760 - login する | |
1761 - shell を呼ぶ | |
1762 + login shell かどうか確かめる | |
1763 - ユーザに設定されてる起動スクリプト?を実行 | |
1764 - 晴れてログイン | |
103 | 1765 |
1766 2008-02-06 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp> | |
1767 | |
109 | 1768 * kernel/spe/*.cpp: new と placement new |
1769 現在、spe kernel のタスクは、切り替わる毎に | |
1770 new/delete を繰り返しています。今はこれでいいんだけど、 | |
1771 速度的にも、いずれは直さないといけないと思うわけで。 | |
1772 で、予め allocate された領域を利用した placement new を使えば | |
1773 new よりもそれなりに早くなるっぽい。 | |
1774 例題として、与えられた回数分 new/delete を繰り返すプログラムと、 | |
1775 同じ回数分、placement new したときの速度の比較 | |
103 | 1776 |
1777 for (int i = 0; i < num; i++) { | |
1778 | |
1779 < task = new Task; | |
1780 < task->init(i); | |
1781 < task->printID(); | |
1782 < delete task; | |
1783 --- | |
1784 > task = new(buff) Task; // buff = malloc(BUFF_SIZE); | |
1785 > task->init(id); | |
1786 > task->printID(id); | |
1787 } | |
1788 | |
109 | 1789 placement new では、delete の必要は無い。 |
1790 その中で新たに allocate してるなら必要かもしれないが。 | |
1791 速度比較は以下。no_new が placement new で、ln_new が new/delete 。 | |
103 | 1792 |
109 | 1793 % ./a.out 10 // 10 回 |
103 | 1794 no_new: time: 0.012135(msec) |
1795 ln_new: time: 0.003572(msec) | |
1796 | |
1797 % ./a.out 100 | |
1798 no_new: time: 0.022453(msec) | |
1799 ln_new: time: 0.018989(msec) | |
1800 | |
1801 % ./a.out 1000 | |
1802 no_new: time: 0.115277(msec) | |
1803 ln_new: time: 0.136335(msec) | |
1804 | |
1805 % ./a.out 10000 | |
1806 no_new: time: 1.056156(msec) | |
1807 ln_new: time: 1.322709(msec) | |
1808 | |
1809 % ./a.out 100000 | |
1810 no_new: time: 10.622221(msec) | |
1811 ln_new: time: 13.362414(msec) | |
1812 | |
1813 % ./a.out 1000000 | |
1814 no_new: time: 109.436496(msec) | |
1815 ln_new: time: 136.956872(msec) | |
1816 | |
109 | 1817 10、100 回だと負けてるが、まあ無視しよう(ぇ |
1818 回数が多くなるにつれて、ほんの少しだが no_new が勝ってる。 | |
1819 どうなんだろうね。ちなみに printID を無くすと | |
103 | 1820 |
1821 % ./a.out 1000000 | |
1822 no_new: time: 0.008512(msec) | |
1823 ln_new: time: 27.100296(msec) | |
1824 | |
109 | 1825 I/O に左右され過ぎ。まあそんなもんだろうけどさ。 |