56
|
1 2008-02-16 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
2
|
|
3 * tag: beta3
|
|
4 ダブルバッファリングを追加し、まあなんとか動いてるんじゃない?って
|
|
5 ところまでですが、所詮 Fifo バージョンなので、
|
|
6 そろそろ Cell を書き上げて、並列にちゃんと動いてるか確かめないとね
|
|
7
|
|
8 * add: kernel/ppe/DmaBuffer.cpp
|
|
9 ダブルバッファリング用に作ったんだけど、
|
|
10 せっかくなので、DMA は、このオブジェクト(が持つ二つの領域)でしか
|
|
11 行えないようにする。ってのでどうでしょう。って話を先生としました。
|
|
12 並列処理だし、ダブルバッファリングがデフォでいいでしょう。
|
|
13 というか、したくなければ swap_buffer とかしなければおk。
|
|
14
|
62
|
15 -Usage
|
|
16 DmaBuffer *buffer = manager->allocate(sizeof(SceneGraphPack));
|
|
17
|
|
18 今までと違い、create_task の in_addr と out_addr には
|
|
19 DmaBuffer をいれてください。ユーザが自分で malloc/new したやつは
|
|
20 エラーを出すようにしてる(seg faultだけどね!)
|
|
21 汚いソースだが、実際に使ってる様子は Test/simple_render の
|
|
22 viewer.cpp で使ってます。sgp_buff と pp_buff ってやつね。
|
|
23
|
|
24 もうすこしユーザに優しいAPIを作りたい・・・
|
|
25
|
29
|
26 2008-02-11 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
27
|
|
28 * add: Test/simple_render
|
|
29 chiaki の DataPack を使った Cube の表示プログラム。
|
|
30 簡単に DataPack を TaskManager の scheduler (SpeManager) に渡して
|
|
31 処理してコピーして、を繰り返してるだけなんだけど
|
|
32 まあ動いてる気がするのでいいんじゃないでしょうか。
|
|
33
|
56
|
34
|
23
|
35 2008-02-10 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
36
|
|
37 * tag: beta1
|
|
38 この状況だと、できることよりもできないことを書くべき?違うか。
|
|
39
|
|
40 - task (親) 中で task (子) を生成することはできない
|
|
41 正確には「生成はできる」だけど、その 子task が
|
|
42 親task に依存している別の task を無視して動くので
|
|
43 ちゃんとした結果にならないと。
|
|
44 8日の Todo にも書いてあるけど、今の実装では
|
|
45 task が task を生成することを想定してない感じなので。
|
|
46 完全に spe 用にのみ狙いを絞った実装であって
|
|
47 OS って言えない実装であるからして、書き直すの?
|
|
48 全ての関数を task しようとするとこうなる訳で、
|
|
49 ある部分だけやるってのはまあできるんだろうけど、うーん。
|
|
50
|
|
51 - chiaki の simple_render が動かない
|
24
|
52 (追記) 解決しました
|
|
53 単に read/write buffer のサイズが足りないだけだった。アホスwww
|
|
54 まあ辱めの為の下は残しておこう
|
56
|
55
|
23
|
56 まだ cvs に commit してないけど、chiaki が書いた、
|
|
57 DataPack 対応の simple_render に TasKManager を組み込んでみた。
|
|
58 といっても、OSっぽく書いたんじゃなく、今は
|
|
59 update_sgp と create_pp だけを task 化してみた。
|
|
60 でまあ動いてるような気はするけど、ものすっごい malloc 系の warning が。
|
|
61 時々長く動くよねみたいな感じになってしまっている。
|
|
62 TaskManager が悪いのか、simple_render が悪いのか。
|
|
63 この TaskManager、ある部分での malloc 系の問題に敏感だなあ。
|
|
64 まあそうでなかったらバグの探しようも無いし、良いっちゃー良いんだが。
|
56
|
65
|
|
66
|
16
|
67 2008-02-08 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
68
|
|
69 * add: kernel/ppe/SymTable.cpp
|
|
70 今まで func[] = {add, sum, ...}
|
|
71 とかやってかっこわるい言われまくってたので
|
|
72 話し合いの通り Symbol Table みたいなものを作ることに
|
|
73
|
|
74 // 疑似コードね
|
|
75 struct sym_table {
|
|
76 char *sym; // シンボル
|
|
77 void *address; // シンボルが示すアドレス
|
|
78 } sym_table[] = {{"Sum", &Sum} , {"Draw", &draw}};
|
|
79
|
|
80 int fd = get_fd("Sum");
|
|
81 void *addr = get_address(fd);
|
56
|
82
|
16
|
83 table には "Sum" と "Draw" っていう二つのシンボルが登録されている。
|
|
84 例えば、ユーザ(カーネル?)が "Sum" ってシンボルにアクセスしたい場合、
|
|
85 まずは get_fd で "Sum" に対する、file descripter を返す。
|
|
86 ユーザは、その fd に従って get_address を取得することが出来る。
|
|
87 TaskManager 的な使い方をするなら
|
|
88
|
|
89 // 俺は今、Draw 関数を使うタスクを生成したい
|
|
90 int fd = manager->open("Draw");
|
|
91 manager->create_task(fd, size, in, out, func);
|
|
92 manager->open では get_fd と同じ使い方です。
|
|
93
|
|
94 まだ改良の余地ありそうですが、今は動いてるってことで。
|
|
95
|
|
96
|
|
97 - 補足
|
|
98 なぜ file descripter と表すか
|
|
99
|
|
100 OS の昨日として、 fopen とかと同じ使い方もできるじゃない!
|
|
101
|
56
|
102
|
16
|
103 * Todo: task が task を生成する際の処理
|
|
104 今まで、 task が行う作業は、演算のみを行うような
|
|
105 単純な実装に決め打ちされているわけです。
|
|
106 しかし、OS なんかだと、タスク中から別のタスクを生成するとか
|
|
107 ありありだと思われる。てか今のテストプログラムでなった。
|
|
108
|
|
109 Test/Sum にあるプログラムで使われるタスク
|
|
110
|
|
111 - init2 // 貧相な名前ですまない
|
|
112 演算する数値とかバッファの初期化
|
|
113
|
|
114 - sum1
|
|
115 ある範囲の整数 (i から i+16 とか) の総和
|
|
116
|
|
117 - sum2
|
|
118 sum1 で求められた、複数の範囲の総和を一つにまとめる
|
|
119 (ex. 複数の sum1 が 1->16, 17->32, 33->48 の総和を計算し、
|
|
120 sum2 で 上の3つの総和を計算する
|
|
121 要は 1->48 の総和を分割するっていうプログラムね
|
|
122
|
|
123 - finish
|
|
124 sum2 で求まった値を表示
|
|
125
|
|
126 この Sum というプログラム、というか OS と言おう。SumOS ね。
|
|
127 SumOS は最初に TaskManager (所謂 kernel) を起動し、
|
|
128 init を起動する。init では、予め決められたタスクである
|
|
129 init2 と finish の二つのタスクを create して登録する。
|
|
130 init2 と finish には依存関係がある (init2 が終わったら finish)
|
|
131 init2 の中で、sum1 と sum2 というタスクが作られる。
|
|
132 sum1 と sum2 にも依存関係はある (sum1 が終わったら sum2)
|
56
|
133
|
16
|
134 今の実装だと、タスクが終了して初めて次のタスクへ行く。
|
|
135 まあ当たり前なんだけど、例えばそのタスクの中で
|
|
136 新たにタスクが作られた場合、そのタスクが終了するまでは
|
|
137 実行されなくなってしまう。
|
|
138 でまあ、今は、manager->create_task される度に
|
|
139 manager->run とかして、無理やり起動してる訳さ。
|
|
140 何が無理矢理かっていうと、scheduler の役目をしている
|
|
141 SpeManager (これも名前変えないと) を2度呼び出してる訳。
|
|
142 つまり、タスク中でタスクを作る度に、SpeManager オブジェクトを
|
|
143 new してるわけさ。いいのか?いや、動いてるけどね?
|
|
144
|
|
145 ちなみに、Cell version だと spe が勝手に取っていってくれるから
|
|
146 大丈夫かなと思いつつ、もし spe を1つしか使わない設定だったら微妙。
|
|
147
|
|
148 要するに、タスク中でタスクが作られる場合の処理を考えないとね。
|
56
|
149
|
13
|
150 2008-02-07 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
151
|
|
152 * memo: プログラミングの姿勢
|
|
153 scheduler とか、task の管理をする部分は
|
|
154 kernel programing のつもりで、
|
|
155 example とか、task に割り当てる処理を決めたりする部分は
|
|
156 user programing のつもりで。
|
|
157
|
|
158 それぞれ違った視点で見る必要がある
|
|
159
|
|
160 * memo: OS というもの
|
|
161 OS 起動の流れ
|
|
162
|
|
163 - PC の電源を入れる
|
|
164 - BIOS が立ち上がる (OpenFirmWare, EFI, BIOS)
|
|
165 - 起動デバイスをチェック (優先度とか種類とか)
|
|
166 - 起動デバイスから Boot loader を起動
|
|
167 + BIOS によって、認識できるファイルシステムが違う(だっけ?)
|
|
168 + ファイルシステムのどこに Boot Loader があるか知っている
|
56
|
169 + grub, grub2, lilo, kboot などがある
|
13
|
170 - Boot Loader が kernel を起動
|
|
171 + ネットワークブートの場合、TCP/IP や
|
|
172 ネットワークデバイス(イーサとか?)のドライバを持ってる必要がある
|
|
173 - kernel は、最初に scheduler を起動する
|
|
174 - scheduler の初期化 (init を呼ぶ?)
|
|
175 - init では、事前?に設定されているスクリプトとかを呼ぶ
|
|
176 + linux とかだと /etc/rc にあるやつを init が呼ぶ
|
|
177 - login form が起動
|
|
178
|
|
179 補足 こっからユーザ
|
|
180 - login する
|
|
181 - shell を呼ぶ
|
|
182 + login shell かどうか確かめる
|
|
183 - ユーザに設定されてる起動スクリプト?を実行
|
|
184 - 晴れてログイン
|
|
185
|
10
|
186 2008-02-06 Wataru MIYAGUNI <gongo@cr.ie.u-ryukyu.ac.jp>
|
|
187
|
|
188 * kernel/spe/*.cpp: new と placement new
|
|
189 現在、spe kernel のタスクは、切り替わる毎に
|
|
190 new/delete を繰り返しています。今はこれでいいんだけど、
|
|
191 速度的にも、いずれは直さないといけないと思うわけで。
|
|
192 で、予め allocate された領域を利用した placement new を使えば
|
|
193 new よりもそれなりに早くなるっぽい。
|
|
194 例題として、与えられた回数分 new/delete を繰り返すプログラムと、
|
|
195 同じ回数分、placement new したときの速度の比較
|
|
196
|
|
197 for (int i = 0; i < num; i++) {
|
|
198
|
|
199 < task = new Task;
|
|
200 < task->init(i);
|
|
201 < task->printID();
|
|
202 < delete task;
|
|
203 ---
|
|
204 > task = new(buff) Task; // buff = malloc(BUFF_SIZE);
|
|
205 > task->init(id);
|
|
206 > task->printID(id);
|
|
207 }
|
56
|
208
|
10
|
209 placement new では、delete の必要は無い。
|
|
210 その中で新たに allocate してるなら必要かもしれないが。
|
|
211 速度比較は以下。no_new が placement new で、ln_new が new/delete 。
|
|
212
|
|
213 % ./a.out 10 // 10 回
|
|
214 no_new: time: 0.012135(msec)
|
|
215 ln_new: time: 0.003572(msec)
|
|
216
|
|
217 % ./a.out 100
|
|
218 no_new: time: 0.022453(msec)
|
|
219 ln_new: time: 0.018989(msec)
|
|
220
|
|
221 % ./a.out 1000
|
|
222 no_new: time: 0.115277(msec)
|
|
223 ln_new: time: 0.136335(msec)
|
|
224
|
|
225 % ./a.out 10000
|
|
226 no_new: time: 1.056156(msec)
|
|
227 ln_new: time: 1.322709(msec)
|
|
228
|
|
229 % ./a.out 100000
|
|
230 no_new: time: 10.622221(msec)
|
|
231 ln_new: time: 13.362414(msec)
|
|
232
|
|
233 % ./a.out 1000000
|
|
234 no_new: time: 109.436496(msec)
|
|
235 ln_new: time: 136.956872(msec)
|
|
236
|
|
237 10、100 回だと負けてるが、まあ無視しよう(ぇ
|
|
238 回数が多くなるにつれて、ほんの少しだが no_new が勝ってる。
|
|
239 どうなんだろうね。ちなみに printID を無くすと
|
|
240
|
|
241 % ./a.out 1000000
|
|
242 no_new: time: 0.008512(msec)
|
|
243 ln_new: time: 27.100296(msec)
|
|
244
|
|
245 I/O に左右され過ぎ。まあそんなもんだろうけどさ。
|