Mercurial > hg > CbC > old > device


Thu Nov 25 17:27:12 JST 1999

subroutine call がない
局所変数もない
その代わり、大域変数を多用する
大域変数のスコープは局所的
Fortran の用に局所変数は静的に取る
recursion する時には、自分で保存する
subroutine call時のレジスタのセーブも局所的に行う
それは、ちょっと変じゃない?
やっぱりデフォルトのフレームは持ち歩くか?

recursive call とそうでないのを区別するか?

fp は用意する方が良い

関数定義と同時に、それ専用のfpの構造体を用意する

C をcompileする時には、stackを持ち歩く
    fp = (struct func_state *)stack
えっと、どこに代入するの? そういう問題もあるわけね。
じゃあ、fpは特別? それは気に入らないな。static
なfpにすれば良いわけね。

func(void *stack) {
    static struct func_state {
	static struct func_state *fp;
	int local1;
	brahbrah...
    } func_state;     // ここまで hidden
    func_state.fp = (stack -= sizeof(struct func_state));
}

func_state をとってくる演算子があった方が良い? そうね。
    func.state
ぐらい?

fp->local1 みたいなことだけするなら、C と同じになる。

call する時のargument も、
    static な func_state に置く
    stack 上の func_state に置く
という二通りの選択肢がある。Cと互換なら、当然、後者。

Recursive なら後者だが、この言語は状態遷移を記述するから、static
なものでも良いはず。

Internal function は? あってもいいんだけど...

Recursive call する時には、 fp をsaveする必要があるね。
    (--(struct func_state *)stack) = fp;
    call callee(&fp->arg,continuation,stack);
call しても、戻って来ないから... continuation は一般的にはcode
だから... それは Internal function にするか。

continuation に一般的にcompileする方法を考えないといけないか。
self は必要なわけね?

言語の名前も考えないといかんなぁ。

C からのコンパイラも書かないといけないのか...

Mon Dec 13 18:53:04 JST 1999

compiler based で、内部で partial evaluation できる?

func をdatabaseとして扱えないなら、それはできない。

しかし、状態遷移としては取り扱える。

    func.state
    func.code

みたいな形にしてpartial evaluationすれば良い

でも止まるのか?

textual でない、中間的なコード表現があった方が良い? <-> interpreter?

Prolog ではなんでいけないの? --> Unification が重いから

Sat Nov 27 13:50:41 JST 1999

func.state とか作るのだったら、
    struct {
	struct {
	    int i;
	} state;
	state *code = {
	    i = i+1;
	};
    } name;
みたいな形で、それ自体を構造化すれば? で、代入すると部分評価される。
代入も可能。なるほど。
	*name.code;
値はあるわけ? 値は &state でしょうね。
self があれば、
    struct {
	struct {
	    int i;
	} state,
	*code = {
	    self->i = self->i+1;
	};
    } name;
かな。self = state だよね。

union の拡張もあわせて議論すると...

Partial evaluator をセマンティクスや実行系にいれておくことは可能か?

byte code とか仮想マシンだったら可能。そうでない場合は?

いずれにせよ、構造体のタグのunique性を修正しないとだめだな。

ヘッダファイルはどうするの?

Mon Dec 13 18:53:18 JST 1999

library との整合性は?

exec sequence では、
    (--(struct func_state *)stack) = fp;
    call callee(&fp->arg);
という形でpointerだけ渡すの? それは変だよね。

値渡しにするとすれば、複数の値を渡せたほうが良い。

    func(void *stack) {
	static struct func_state {
	    static struct func_state *fp;
	    int local1;
	    brahbrah...
	} func_state;     // ここまで hidden
	func_state.fp = (stack -= sizeof(struct func_state));
    }

の引数自体が、構造体であるべき。

    func(
	struct void *stack
	) {
	static struct func_state {
	    static struct func_state *fp;
	    int local1;
	    brahbrah...
	} func_state;     // ここまで hidden
	func_state.fp = (stack -= sizeof(struct func_state));
    }

で、構造体に register storage を許す。

    func(
	static struct argument {
	    register void *stack;
	    register void *continuation;
	}
	) {
	static struct func_state {
	    static struct func_state *fp;
	    int local1;
	    brahbrah...
	} func_state;     // ここまで hidden
	func_state.fp = (stack -= sizeof(struct func_state));
    }

すると、caller の方も、構造体を引数とするのが自然。

    call caller(
	static struct argument {
	    register void *stack;
	    register void *continuation;
	} arg = {a,b};
    )

みたいな。もちろん、この構造体はインタフェースと呼ばれる。

argument は、callee にあった方が良いけど、caller 側にあっても
良い。register なんかは、そう。

	caller(interface caller_arg = {a,b,c})
みたいなsyntax かな。
	caller->interface = {a,b,c};
	*caller->code;
を、
	caller(a,b,c);
と称する。

function には、interface と code と state があることになる。

state にアクセスする時のlockは? protected state? synchronized state かな?
もちろん、sequential implementationでは、そんなものはいらない。

function {
    interface:
	register int a;
	register struct self self;
    state:
	int b;
	serialized int c;
    code:
	b  = a;
}

int にvoid value を定義する。実装は重くなるけど...

serialized の semantics は?

もう少しmicro-Cに近く!

carrying state と static state。

Mon Dec 13 19:42:41 JST 1999

interface に register keyword を使うのは、あまりに
実装よりすぎる。でも、でないと状態にできない?
そんなことはないか。やっぱりcaller側のstatic 領域に
直接書き込む?

だとCより遅そう。でも、引数に40個とかかかれたら...

Wed Dec 15 14:09:49 JST 1999

C と互換にする?
	goto function(arguments);
	goto *continuation(arguments);
みたいな感じで。

stackの管理は? どうせ、library との互換はとらないと
いけないんだから...

local 変数がある場合は stack を動かす。でも、戻す奴がいない。
closure 化するか?

return した時の挙動が複雑になる。大域returnするわけだら。

arguments をstatic 領域にかきこむ方式だと互換性がとれない。
stack 上の frame pointer 上にないとダメだから。

両立させるのは無理か? つまり、これだと、呼び出された方の
frame semantics は、C と互換になる。だから、stackの直後に
frame pointer があると思っている (そうか? ) frame pointer
stack pointer に沿って移動した直後に、そこからのoffset
で引数を操作することになる。

つまり、それはだめだったことじゃない? つまり、goto だと、
frame pointer は、stack の直後とは限らないから。前の
frame pointer 相対に引数にアクセスしてくれれば別だけどね。

stack に引数を積むのは容認して、goto の場合は、向こう側で
stack を畳むってのは?  ということは、普通の関数と定義の
方法を変えるってことか。ま、悪くはないか。

すると、goto のsemantics は、C と互換になる。それを受ける
方が異なることをする。それは、なんかおかしいな。それに、
それだと関数呼び出しが軽くならない...

ということは、やはり、C のcall は、call function で
実現して、その他の呼び出しは、すべて、goto 扱いに
する方が正しいだろう。

問題は、この言語の関数をcallされた時だな。dual entry にして、
call の時と、goto の時を区別するか。
	func:	stack processing
	func_goto: normal processing
         ...
みたいな感じ。でも、return はないから...

このあたりも自分で記述できる言語であるべきだよね。その通り。
つまり、C とのstub も自分で記述すると言うことか。

protocol function {
    interface c {
	register "%esp" struct {
	    entry code ret(int);
	    void *fp;
	} *sp;
	register "%ebp" void *fp;
    };
    code function_code {
	fp = sp;
	sp += sizeof(struct local);
	struct local *local = sp;

	local->i = 1;
	goto *fp->ret(local->i),sp=fp;  // return(local->i);
    };
}

みたいな感じでさ。さっすが、アセンブラ。いまいちreturnが汚いけど。
まぁ、return はそのままreturnでもいいけどさ。

あ、これは良いかも知れない。code が複数かけるから。

state 以外は、consistent state であることを保証しない。ってのは?
local 変数は使っても良いけど、call/goto の前後で、値を保証しないか...

うーん、だんだん炸裂してるなぁ。

だから、レジスタに対するマッピングの記述と、そうでない部分の
記述は分離するべきでしょうね。


全部一辺に実装するわけにはいかないからぁ...

Thu Dec 16 13:44:21 JST 1999

lock は状態遷移レベルで実現するのだから、self などを
使ってlockする必要はないはず。

全体の直列化は、状態遷移レベルで、
	lock(storage) -> transition
みたいな形で記述すれば良い。この当たりを、どのように記述するかは
もう少し先送りしよう。


引数はレジスタ渡しにしよう。長い引数は、呼び出し側の領域への
ポインタとする。実装を規定しても良い。そうすれば、varargs
みたいなものはなくなる。だいたい、なんで、そんなものがいるんだろう?
配列を渡せばいいじゃん。

なので、引数は一つ(or 二つ)に限るという方法もある。

とすると、やはり、前もって静的領域や動的領域を確保することは
できない。

この言語では動的領域は自分で確保するわけだから、その点は問題ない。

Thu Dec 16 20:24:55 JST 1999

とすると関数呼び出しは、
	# register save
	# set 1st argument in register %eax
	# set 2nd argument in register %ecx
	# set extra arguments in save area
	# set extra argument pointer in %edx
	    jmp function
という形式になるわけね。second を処理するのはめんどくさいから一つ
にしよう。

えーと、frame pointer はないけど、コンパイルの手順からすると
あった方が良い。しかし、frame pointer そのものをstatic
にとるのはまずい。だから、frame pointer がfirst argument
ということにする方が正しい。とすると引数は、さらに、その
後と言うわけか。
	f(fp,argument)
fp を渡すのにさらにargument をレジスタで渡すのはおかしい。おかしいけど、
ま、良いか。

return しないなら、return type の定義をとるのは変だな。

f(fp,arg1,arg2,arg3) とすると、それぞれが決まったレジスタに入って、
多い分は配列にあると思われる。ふむふむ...
    fp->xx
でアクセスすれば、そのまま局所変数になる。全部、配列で
送っても良い。

  .set label,value

で as は値をセットするようですね。

関数コールの後は戻って来ないから後始末の心配はしなくてよい。
frame pointer を使ったら自分で面倒を見ること。

だと
	a = atoi(s);
みたいなことはできない...

普通のCの定義と交じると間違いやすい。

とすると、struct と同様に、
	protocol
	code
	interface
	state
を用意するわけね。時間あるのかぁ?

とりあえず、register 渡しのfunction 定義とgoto文を実装する。

code name(register "%ebp" void *arg) {
    goto name(arg);
}

ぐらいかな? で、first argument が必ずregisterにのるようにしないと
いけない。register storage class を入れて、
    register "%ebp" void *arg
とかするわけね。

ってことは、まず、レジスタを実装しないといけないわけね。

で、stack を使った演算は、一応、そのままにする? それでも動くはず。
式の途中でgotoは使えないんだから、それでいいはず。

で、それから、これを拡張していく。

interface c {
    register "%ebp" void *arg;
}
code name(interface c) {
    goto name(c.arg);  // c. は省略可能
}

とかね。さらに、

protocol name {
    interface c {
	register "%ebp" void *arg;
    }
    code name(interface c) {
	goto name(arg);
    }
    code name1(interface c) {
	goto name(arg);
    }
}

などとするわけか。なんと、これが C と共存するわけね。うーん。

Fri Dec 31 11:44:03 JST 1999

code でなくて、別な名前のほうが良くない? segment? action?

レジスタ名が入るのは、やっぱりいや。optionalには許す。

interface は構造体のようなものだから... 構造体でいいんじゃない?
構造体の場合は... malloc する? う、うーん。malloc するとして、
いつfree するの?

再入するときには、壊れてていいんじゃない? multi-thread でなければね。
multi thread では、状態は、レジスタ経由または、thread local に持つ
必要がある。static は、だから thread local に持たなくてはならない。
大域変数に割り振っちゃだめ。でも、いまは、やめて

interface は、とりあえず、二つまでの値渡しにしよう。
	self と arg
ですね。

もう少し拡張しやすいコンパイラがいいなぁ。

    code name (c,a)
    struct state *c; struct arg *a;
    {
	goto name(arg);
    }

local 変数は? この互換性の問題かぁ。

KL/1 を意識して、interface は heap に置くことにしても良い。
GC は言語に入れておくべきだが、interfaceは machine independent
であるべき。だとすれば use/forget みたいものはいるだろう。
でも今のところは考える必要はない。

えーと、
    code name (c,a)
    struct state *c; struct arg *a;
    {
	int i;
	goto name(arg);
    }
の時の一時変数iはどうするの? 基本的にはレジスタ割り当てだけど...
使用させない? んー、大胆な御意見。まぁ、やっぱりheapに割り当てちゃう
のが簡単か。でも、どうせ抜ける時にはいらなくなるわけだから...

ほんらい、この変数は、次のcallでは必要無くなるのが普通。

とにかく、レジスタ変数は必要なんでしょう?

だから、GC と合わせて言語を設計すべきだよね。API を規定して、
異なるGCを選択できるようにする。

Sat Jan  1 22:40:22 JST 2000

とーにかく、 storage class register を実装しよう。

    stmode=REGISTER

で、local storage とおなじ扱いとする
	static register? は、ない。

symbol table に storage class をたせば? dsp==EXTRN で判定しているから、
local 変数が36以上あるとおかしくなるぞ?

sc  は GVAR/LVAR だけど、register は LVAR の特殊な奴だから、
sc に入れるほうが正しいか...

Sun Jan  2 01:47:17 JST 2000

register 変数はできました。けど、register を二つ使うと、
一杯になってしまうので、REGISTER6 でコンパイルしないと
結構ひどい。が、register 変数を%esi,%edi に割り当てれば
いいか。

Sun Jan  2 04:43:04 JST 2000

で、
    code name (c,a)
    struct state *c; struct arg *a;
    {
	goto name(c);
    }
の一時変数無しは実装できます。引数は二つまでね。

	.file "tmp.c"
	.version	"01.01"
gcc2_compiled.:
.text
#
# code name(c,a)
	.align 2
.globl code
code:
	.type	code,@function
#    struct state *c; struct arg *a;
# {
#	goto name(c);
	movl %esi,%esi
	jmp	name
_5:
	.size	code,_5-code
	.ident "Micro-C compiled"

う、すごい。

goto 文がめんどくさい。stack をたたんで、jmp すれば
よいだけだが..

Sun Jan  2 11:17:50 JST 2000

普通のcallをcontinuation baseにすることができる?

Sun Jan  2 20:28:45 JST 2000

goto 文だけど、やはり、一度、expr で生成してから、top level
で jump code を生成しよう。

Tue Jan  4 03:32:55 JST 2000

code をtypeにしないと、
	code *p;
とか書けないね。
	int *p();
と同じだけどさ。


    main(ac,av)
    int ac;
    char *av[];
    {
	goto code1(ac,av);
    }

    code code1(ac,av)
    int ac;
    char *av[];
    {
	if (ac)
	    goto code1(ac,av);
	else
	    goto ac(ac,av);
    }

Tue Jan  4 04:56:56 JST 2000

うーん、なんかレジスタにつむ順序が違う
これは、adecl がreverseにつむから。

code のreturn

やはりcodeはtypeにしないとだめ。

main()
{
    goto code1();
}

とかだと、main に戻って来れない。もちろん、code1() 以降で、
return するわけにはいかない。(main の disp をcode1 は知り得ない)
goto label をcode1の引数に送れば?

main()
{
    goto code1(ret);
ret:
}

これだと、ret がforward labelかどうか分からないけど?

code1 中で使う中間変数を stack 上にとるのは悪くない。しかし、それを
%ebp 経由でアクセスするということは、main の中間変数を壊すということ。
それを防ぐには、main 中のgoto codeで、%ebp を修正してやれば良い。
(今は戻って来ないので問題ない)

code1 のgoto では、戻って来ないから、その必要はない。しかし、
label をcode1 中で渡されると、ちょっと気まずい。

とすると、それは禁止して、main() 中でstackをたたんでからgotoするか?
そうすると、無限後退して、結局、帰れないことになる... うーん。

main() 中のlocal code を許せば、それは解決するが..

main()
{
    goto code1(code2);
    code code2() {
	return;
    }
}

みたいな感じ。でも、そうするとscope rule を変える必要があるので厳しい。
ま、悪くはないけどね。

continuation を明示する方法もある。

main()
{
    goto code1(continuation);
}
code code1(ret)
code (*ret)();
{
    goto *ret;
}

かな? call/cc ?

label へのgotoを許すのもいいけど、
でも、label を許すと、すごくspaghettiにならない?


Tue Jan  4 11:47:24 JST 2000

continuation じゃなくて、return keyword を使おう。
(実際、continuation と少し違うし)
type が少し変になるけど、まあ良い。

int
main()
{
    goto code1(return);
}
code code1(ret)
code (*ret)(int);
{
    goto *ret(3);
}

だな。prototype も付けないといけないか。

Tue Jan  4 12:21:44 JST 2000

これだとmethodがすべてstatic になってしまう。dynamic なmethod
呼び出しにするには? dispatcher を自分で作ることになる。かなり
めんどくさいが...

code method(obj,arg)
{
}

か、あるいは、inline にするか... #define のかわりに inline ねぇ。
これはあとで考えて良い。

Tue Jan  4 14:22:19 JST 2000

main の変数を書き潰すのと、goto (*reg)(123) での値は、
register 渡しで、current register にのらないので、
結局、return label は専用に作る必要がある。

Tue Jan  4 18:14:07 JST 2000

stack を継ぎ足して、呼び出す方式を取れば、call by value
のregister 渡しを制限する必要は無くなる。

複数の値を返すことも容易だ。

	.file "tmp.c"
	.version	"01.01"
gcc2_compiled.:
.text
#
# code name(a,b,c,d,e,f)
	.align 2
.globl code
code:
	.type	code,@function
#    struct arg *a,*b,*c,*d,*e,*f;
# {
#	int g;
#	goto name(a,b,d,e,f);
	jmp	name
_5:
	.size	code,_5-code
	.ident "Micro-C compiled"

おお?!
	%esp  new %esp = old %esp - 12 -4
	%ebp-4     = g
        %esi       = a
        %edi       = b
        %ebp = old %esp   0
        %ebp+4     = c       code_arg_offset=0
        %ebp+8     = d
        %ebp+12    = e
        %ebp+16    = f

interface は付けよう! というか、
	goto name(struct {xxxx})
みたいな感じで良いわけね。どれをregisterにいれるかと言う問題はあるが。

で、どうやってcallすればいいわけ? emit_pushするかわりにpush
する?

うう、これでは、だめか。code argument の数が変わると、
ebp をいちいち動かすことになる。そこにはold sp があるから
そいつもコピーする必要がある。

	%esp  new %esp = old %esp - 20
	%ebp-20   = g
        %esi      = a
        %edi      = b
        %ebp-16   = c code_arg_offset= -16 ((nargs-max_reg)*int_size)
        %ebp-12   = d
        %ebp-8    = e
        %ebp-4    = f
        %ebp = old %esp   0

そうか、function からcallする時には、local 変数を書き潰して良い。

#	goto name(a,b,d,e,f);

	%esp  new %esp = old %esp - 20
	%ebp-20   = g
        %esi      = a
        %edi      = b
        %ebp-16   = c code_arg_offset= -16 ((nargs-max_reg)*int_size)
        %ebp-12   = d
        %ebp-8    = e
        %ebp-4    = f
        %ebp = old %esp   0      disp=0 (*)
         local1 <----16 local variable
        %edx        -12   <- disp_offset
        %ecx         -8
        %ebx         -4
        %ebp = %esp   0
        %eip          4   <- arg_offset

となる。ということは、pushl %ebp は、間違い。

だけど、%ebp をそのまま使うのは良くない。disp_offset がかかっているから。
だから、もう一度 pushl %ebp したほうがよい。しかし、push する先は、
上の、(*)。
	leave           movl %ebp,%esp
			popl %ebp
じゃなかったか?

Thu Jan  6 13:00:33 JST 2000

できたね。これでとりあえず動くはず。速度は問題だが...
あとは、
	ANSI-C prototype
	ANSI-C prototype check
	Interface Definition
	GC support
	Direct handling of Frame
だね。簡単に出来そう? たぶん...

Fri Jan  7 09:42:53 JST 2000

goto 文が動いてなかった。あと peep hole optimization version も
作るか?

continuation として label を送れるようにするべきか?
そうすると便利なんだけど、ちょっと、汚いプログラムが
出来るようになる。あと、送り側の環境(frame)を維持する
必要がある。ま、できなくはないか...

そうすると、label が値を持つようになる。
	a = label:;
とか。うーん。label:(a,b,c) {}; みたいな形で、parallel 代入を許すと言う
手もあるね。

こちらの方がCとの相性は良いが... main() { label:(){ ... } }
みたいなnestを許すかどうかと言う問題がある。
変数の参照を許さなければ、特に問題はない。

a = label: は、二重の意味があるなぁ。

言語の名前。DinnerBell II とか? join も入れる?
	code entry_a().entry_b() {}
ですか? parallel call も?

Fri Jan  7 19:53:53 JST 2000

いまのままだと return が環境を持ってないから、大域脱出できない。
まぁ、環境を入れてもいいんだけど、どこに置くかと言う問題が
あるね。

そうじゃなくて、return 側で判断するか?
	return(ID)
みたいな形でIDで判断する。そうすれば、return 側でID
を見て判断できる。けど...

まぁ、はやり、環境を持って歩く方がいいかなぁ。でも、
引き渡しているから、二つ引き渡して、片方を使われたときに、
反対側が消えてしまうのはいたいよね。今のままならば、
そういうことは起こらない。

continuation 特有の問題を避けるなら、このままでもいいんだが...
continuation や環境は、このシステムでは自分で作ることが
できるからね。

そうなんだけど.... retlabel や retcont は実はオブジェクト
全体に一つあれば良い。

引数を渡すときに、そこに環境へのポインタをいれてやれば良いので、
解決は割と簡単だが、そうすると、例の構造体を引数で渡すと言う
問題を解決する必要がある。

でも、今の実装ならば、まったく同じ変数の構成ならばコピーは
実際には起こらないわけだから問題ないはず。特に、それを保証するために、
interface を実装する必要がある。

return ->
	(void *)old bp
	return address

bp を直接操作できるようにするといいんだけど....

Sat Jan  8 08:49:59 JST 2000

今は、code 内ではreturnできないわけだけど。実は、return って、
	code return0(i) int i; { return(i); }
か? 今は禁止してないから書けちゃうよね。どういうcodeが出るんだろう?

doreturn() では retpending をセットしているだけだから、control=1
のまま。で、code の終りにくるのでエラーになる。checkret は、
statement の引数で判断するようにしたほうが合理的だろう。

大域脱出は結構根が深いよね。途中をスキップされてうれしいか?
destructor と同じで、途中のcodeは全部呼びたいのが普通だろう。

bp が同じになるまで return すれば良いわけだよね。
return と同じで、明示的に環境を引き渡すようにするか。
type は void * で良い?

return する時にstackの上限を越えているかどうかを自分でチェックする
必要があるね。誰にreturnするかをcodeで明示すれば良いわけだけど。

	code return0(i) int i; { return(i); }

を許して、そこで、frame pointer を大域あるいは渡した引数と
比較して処理する?
	code return0(i,env) int i; env *env; {
		if (env==self) return(i);
	}
あれ? これはおかしいよね。
	code return0(i,env) int i; env *env; {
		if (env!=self) {
		    env->return();
		    return(i);
		}
	}
も、なんか変だよなぁ。呼び出しと逆順に帰りたいわけだが...
実際、逆順には帰っているわけだよね。

return の中でこそこそ比較するという技もあるけど。

問題は、destructor に渡す情報だよね。もちろん、self で良いわけだが、
このあたりは、言語外の問題で、それを明示的にしたいから、この言語を
作っているわけなのだから、これを内部で処理するのはおかしい。

	code return0(i) int i; { return(i); }

これだと、return の型が合わないと言う問題が生じるな。簡単には
チェックできない。
	int
	main() {
	    code a() {
	    }
	    code b() {
		return(i);
	    }
	}
にすれば、check はできるようになる。でも、これだと、
	int
	main() {
	    a: {
	    }
	    b: {
		return(i);
	    }
	}
と差がない。module 化を言語外でやるというのが主旨なのだから、これでは
まずい。これは高級アセンブラなのだから。

あそうか、return と、大域脱出時のabortとは、状況が違う。だから、
別なcode を呼び出さないとだめ。あるいは、値で区別するか。これは、
logic programming のfail/success と似ている。
	main() { } abort { ... }
でもいいけど?
	main() {  code abort { ... }; code return { ... }}
かな?

本来、subroutine call自体が、かなりの省略形なわけだから、これは
仕方がない。今のままで通常のsubroutine callをシミュレートできるのか?
	code (struct arg {...},void *sp) {
	    struct env;
	    push(sp,arg);
	    push(env,arg);
	}
できるけど、ちょっと重い。やはり、frame pointer を直接操作しないと
だめ。

goto 文のほうに、env を一緒に送るものを作ったほうがいいのかも。
	goto (*ret)(),environment;
かな。type は? (void *)?
	goto ret(),environment;
にはならないの? そうすれば、自分でthreadを制御できる。environment
の正当性を評価しなくて良いの? まぁ、ねぇ。

これは実装は容易だが... goto といちいち書くのが本当にいいのか?
env に対するoperationがあった方がいいなぁ。push とか?

	code return0(i) int i; { return(i); }

を認めれば、return 擬変数はいらなくなる。

でも、実は、return は、caller の引数の数と一致してないといけない
わけだから、 code return0(i) int i; { return(i); } はだめ。env
と一致してないといけない。ということは分離するとまずいんじゃない?
あれ? そんなはずないな。

Sun Jan  9 01:15:56 JST 2000

やはり、分離してはまずい。もともと、
	goto func(arg);
自体が、
	goto func(arg) with current.env
みたいなものだ。つまり、これは、DinnerBell の、
	self message: arg
と同じ。self->func(arg); でも良い。が、function callと区別が付かないのは
良くない。

そうすると、type code はsize int でなくなる。
	code *p = func;
ではいけなくて、
	code p = {func,env};
でないといけない。実際、
	goto func(arg)
では、current environment を pushl %ebp でstack = current env
に積んでいるわけだから。

いずれにせよ、
	struct p = q;
は実装する必要がある。localな、
	code p = {func,env};
も動くはずだが...

	code (*p)();
	goto (*p)(arg);

はだから少しおかしい。これは、goto がenv を補っていると考えるべき。

このようにすると、常に、
	func,env
の組をcodeとみなすことになる。これは、object と呼ぶべきだ。
ただ、既存のobjectとは別だよな。actor の方が良い?

うーん、これでjoinを入れれば、完璧なDinnerBellだな。並列送信はないけど。

Sun Jan  9 01:40:05 JST 2000

local 変数の初期化はallocation の後に遅らせる必要がある。
nptr に入れられるはずだよね? nptr に初期化フラグを足すか?

文途中で出現するlocal変数の初期化。ちゃんと動いているの?

構造体のcopyは、lcheck を修正すべきでない。

Sun Jan  9 08:49:43 JST 2000

うーん、なんか修正が多いなぁ。あと、関数呼び出し、goto 文の
構造体への対応か。

	goto (*code)();

が、self env を使うのか、code の先の値を使うのかを区別する
必要がある。もし*を使わないとするとlabel(FNAME)との区別が
つかないぞ。あ、でも、環境を持ち歩くことにしたから、label
へもjumpしようと思えばできるね。

並列送信はなくても、この構成ならばstatement単位の並列性を検出するのは
容易だろう。

やればできるけど、この修正の量だと1日じゃ終らないかなぁ。
浮動小数点も入れるのでしょう?

Mon Jan 10 09:00:12 JST 2000

引数に構造体を許すには、必ずANSI-Cにする必要がある。難しくは
ないが...

goto 文には label, code, continuation の3つが来る。
	continuation = code + env
			| label +env
なのだが、code/label では、env の内容が異なる。できれば面白いが、
その価値はあるのか?

しかし、code , env を分離するとあまりに危険すぎる。どうせgoto
が危険なんだからいいか? その方が簡単。簡単なら、そっちの方法を
とるべきじゃない? うーん。

return の関数依存性はなくした方が良い。
一つにするのは、pop の問題があるので良くないが...

そうか、ret をenvを指定して戻るようにしたから、leave する必要は
なくなった。そして、push %ebp に相当する部分は、lea -disp(%ebp),%sp
で消去されている。ということは、jump のfunction依存部分はいらない
ということだね。

でも、汚いなぁ。read only属性をhardware supportできればなあ。

sched_yields() 相当を書けるかな? lock は?

一応、できたけど、やっぱり汚い。

Wed Jan 12 16:12:27 JST 2000

あは。ANSI prototype はめんどい。
	bexpr()
で、関数での引数の順序と、そのあとの宣言の順序が変わることがある。
そうすると、うしろの方が優先されてしまう。これは、こまる。

そうか、code_arg_offset のような方法だと、ANSI style では、
困ってしまう。

Thu Jan 13 04:46:12 JST 2000

#       goto name(a,b,d,e,f);
        code name { int g; ...

        %esp  new %esp = old %esp - 20
        %ebp-20   = g code's local variable
        %ebp-12   = f <- new_disp
        %ebp-8    = d
        %ebp-4    = d
        %ebp-0    = c
        %edi      = b
        %esi      = a
        %ebp = old %esp   0      disp=0 new env
         local1 <----16 old local variable       ( to be erased )
        %edx        -12   <- disp_offset
        %ecx         -8
        %ebx         -4
        %ebp = %esp   0   <- old env
        %eip          4   <- arg_offset


Thu Jan 13 13:38:24 JST 2000

だいたいできたけど、test/tmp7.c のprintf のtype mismatch は
なんなんだろう?  ANSI の副作用だろうなぁ。

これだと、プロセスの切替えのときには、結構な量のデータを
コピーすることになる。それでもいいんだけど...

それごと、どっかにとって置く。continuationへの参照みたいなもの
ができないかな。

コピーができれば、environment/return の組は動くわけだから、
それへの参照と切替えがあっても良いよね。

Fri Jan 14 12:03:35 JST 2000

Libretto のkeyboardが壊れた... control key が効かない...

printf の参照の問題は解決しました。list2 がlocalなheap
に割り当てているのがいけなかったね。

return の処理は、goto 文で処理するより、environment に
returnto する方が良くはないか?

environment は実は送り先でそれなりの準備が必要。
new-environment() みたいなlibrary があれば、thread にできる。

join は?

funcall を用意すると良いね。

Mon Jan 17 15:23:34 JST 2000

    struct aa f1() {
	return bb;
    }

みたいなのは? 関数の型か代入の型を見て、crn にpointerを渡して、
あとでcopyしてから stack を畳む。

    # 	bb=f1(aaa);
	    movl $bb,%eax
	    pushl %eax
	    movl $aaa,%eax
	    pushl %eax
	    call	main2
	    popl %edx
	    copy %eax,%edx,$400
	    addl $400,%esp
    #     return a1;

あ、でも、それだと、local変数を返したときに困るね。leave; ret;
してはいけなくて...

あ、やっぱり、こういう場合はコピー先をmain2に引き渡しているみたいね。
    void f1(struct aa *ret) {
	*ret = bb ;
	return;
    }
と同じか。これは簡単。
	f1().a[55]
みたいな場合は、局所変数に強制的に取ってしまうみたいね。それはそうだ...
が、うちの実装だとちょっと厳しいか。
	leal $-sizeof(struct),%esp
	pushl %esp
なんだけど、関数呼び出しの途中ではできないから....

    # main(ac,av)
    # int ac;
	    .align 2
    .globl main
    main:
	    .type	main,@function
	    pushl %ebp
	    movl %esp,%ebp
	    pushl %ebx
	    pushl %ecx
	    pushl %edx
    # char *av[];
    # {
    #     register int i;
    #     register char *p;
    #     int j = 3;
    #     struct { int b; void (*c)(struct aa); } q = {3,main1},r;
    #
    #     j = 3;
	    subl $20,%esp

このsublを後から指定してやればOk。

でも、それだと jump の時にずれない? ずれるか? ずれるね。うーん。
実行時にチェックしてやるのも変だし。

まぁ、それほど必要な機能ではないんだけど。

これもcontinuationを渡してやると言う手法が使えないことはないんだが...

関数呼び出しの最初にやってやればいいか。それでできるかな?


Sun Feb 20 23:59:16 JST 2000

MIPS のcall frame

	$sp = $fp
			local variables
        		saved register (including $31 = return address)

mask  は使用したレジスタのbit pattern
 -4 は何?

  18                            .mask   0xc0000000,-4
  19                            .fmask  0x00000000,0
  20 0000 D0FFBD27              subu    $sp,$sp,48
  21 0004 2C00BFAF              sw      $31,44($sp)
  22 0008 2800BEAF              sw      $fp,40($sp)
  23 000c 0000000C              move    $fp,$sp
  24 0010 21F0A003              jal     __main
  25 0014 03000224              li      $2,0x00000003           # 3
  26 0018 000082AF              sw      $2,a
  27 001c 04000224              li      $2,0x00000004           # 4
  28 0020 00C082AF              sw      $2,b
  29 0024 05000224              li      $2,0x00000005           # 5
  30 0028 000082A3              sb      $2,c
  31 002c 06000224              li      $2,0x00000006           # 6
  32 0030 08C082A3              sb      $2,d
  33                    $L1:
  34 0034 21E8C003              move    $sp,$fp                 # sp not trusted
 here
  35 0038 2C00BF8F              lw      $31,44($sp)
  36 003c 2800BE8F              lw      $fp,40($sp)
  37 0040 0800E003              addu    $sp,$sp,48
  38 0044 3000BD27              j       $31
  39                            .end    main

これと同じようにするならば、registerの使用数を最初に調べる必要が
あるのだけど、one path compiler である micro-C では、それは
できない。したがって、enter は後ろでする方が良い。

Mon Jan 20 18:25:27 JST 2003

3年間さわってないのかよ。何やってんだ?

goto 文のバグをとらないといけない。

まず、関数引数の構造体の展開。これは、どうってことないはず。

   goto (*code)(i+1,j,...)

まず、いじらなくてすむ変数を摘出する。

   foreach arg
      compare

単純演算 ( op+const , pointer , const assign ) などは、ここで検出する。
大半は、そのようになるはず。
レジスタに乗せる分があるから... それには触らないとして...

複雑なものは、前もって計算しておく。(get_register する)
スタック上かレジスタ上に作る。

残りは並列代入となる。再帰的に計算する。

えーと、大きな順にやるんだっけ? 小さな順にやるんだっけ?
    code f( int a, int b, int c ) {
        goto g(b,c,a);
    }
みたいなやつだよね。

    移動するものを一つ検出する。
    そのために移動が必要なものを移動しておく(再帰)
    代入する

こんなんでいいのか? ループしない? するよね。ループしたら
get_register する。

前の例だと、

    g(b,c,a) のbに着目する。
    bに代入するコードを出すと、a が壊れる。
    a が必要かどうかを調べる。それは、引数のリストを見ればわかる。
    その前に、a を移動する。a の移動先を見て、
       空いていれば、移動してOk。しかし、c
    なので、 c を見る。と b になるので、ループするのがわかるので、
    b を get_register する。
    で、c が移動できる。で、aを移動して、とっておいたbを代入。

Tue Jan 21 22:45:09 JST 2003

とりあえず、jump は複雑すぎる。もっと簡単にすることを考える。
parser 側である程度処理できない?

     goto f(a+3,b(),c);

などを、

     a = a+3;
     b = b();
     goto f(a,b,c);

程度に簡略化する。この時、f(a,b,c) は(できるだけ)、元の
関数の引数リストに近付ける。のは無理なので、単純変数
まで落す。

あまり関係ないか。一時変数はどうせいるわけだし。ってこと
みたいね。

だとすると、元のコードと、そう変わらんね。前のも、そんなに
悪くないってことか。

Wed Jan 22 14:33:12 JST 2003

やっぱり、途中で局所変数を増やしたいよね。

Fri Jan 31 20:30:36 JST 2003

なんか #ifdef / #if がないとだめだな。実装する?
しました。

Tue Feb  4 01:04:12 JST 2003

##      while ((*chptr++ = c = getc(filep->fcb)) != '\n') {
_1120:
        movl $10,%eax
        movl $8,%ecx
        movl filep,%edx
        addl %ecx,%edx
        movl (%edx),%edx
        pushl %edx
        xchg %edx,%eax     .... edx に$10が入る (なんでxchg?)
        call    getc
        addl $4,%esp
        movl %eax,-20(%ebp)  c に代入
        movl $chptr,%ecx
        pushl %ecx
        popl %ebx
        movl (%ebx),%ecx      ecx にchptrの中身
        addl $1,(%ebx)
        movb %al,(%ecx)
        subl %edx,%eax         eax-edx ($10)
        je      _1119

が壊れる理由なんだけど...

edx,ecx が破壊されちゃうみたいね。

Tue Feb  4 12:17:07 JST 2003

ようやっと直したよ...

use_pointer って、なにもしなくていいんだよね? eax,ebx を避ける
ってことらしいけど。

inline/引数付き #define 欲しくない? 置き換えは、local name stack に積んじゃう。
展開は function  で行う。

getch を工夫する必要はあるが。置き換えスタックが必要。


Wed Feb  5 01:16:00 JST 2003

大域で定義された struct field が大域変数と重なっていると落ちる。
そりゃそうだけど。どうするの? (直した記憶があるんだけどなぁ...)
struct 毎に field 名とoffset/type の組を持てばい良いんだよね。

なんだけど、タグ無しの構造体もあるから、型名の方に付ける必要
もある。というのは、型名のない構造体もあるから。タグ名には、
一応、リストがついている。なんかに使う必要があったんでしょう
ね。あ、めんどう。無条件にやっても大域変数名を汚すのを直すの
が難しい。

ちょっと、あれだけど、「型名.フィールド名」で登録してしまうのはどう?
型名が後で出て来るところが気まずいが...

def で登録するときに、nptrにdispを代入せずに、struct field list
(大域変数) に入れて、type の方に、field list (list3(nptr,offset,
type)) を入れれば良い。

あとは、strop の方でtypeのlistを見るようにすれば良いわけだ。

これなら、簡単に直せるはず。LUSTR/GUSTRなどの区別もなくなるし。

Wed Feb  5 02:10:14 JST 2003

浮動小数点ねぇ。完全なANSI Cにするのは大変。でも、
浮動小数点ぐらいないと。

code generation part を、さらに分割して、
複数のコード対応にしやすいようにする。
おそらく、それほど共有する部分はないけどね。

Sample C code をコンパイルして、その結果から(半分手動で)
Micro CbC code generation part を生成する方法を用意する。


Thu Feb  6 11:47:03 JST 2003

Code Segment を単位として使うときに、大域変数はどういう
ように分けるの? static なんかは意味ないよね。

もちろん、自然にグループ分けされるわけだけど。

あとデータフローだよね。データフローに関しては、
あんまりやってないなぁ

Fri Feb  7 14:36:15 JST 2003

inline では、必らず、局所変数の増加がある。また、inline
は普通の関数として展開しておく必要もあるらしい。(何故?)

#define ねぇ。

   #define c(a,b)  g(a+1,b+1)
   #define g(a,b)  printf("%d %d\n",a+1,b+1);

   main() {
       int a,b;
       a =1; b = 3;
       c(a,b);
   }

local #define がいるんだよね。g の中で a が出て来た時には、
c のa の置き換えは起こってはいけない。ということは、c
の置き換えはg が始まる前に終っている必要がある。dynamic
scope なんだから、assoc の上乗せで良いはず。
macro のlevelを定義して、あるレベルでは、それ以前の展開
を行わないという手法が良いかな。

   c(a,b) =>  a=>"a+1", b=>"b+1"
   g(a,b) =>  (a=>"a+1+1",a=>"a+1"), (b=>"b+1+1",a=>"a+1")

みたいな感じ?

やっぱり関数解析でマクロ処理をやらせるのは無理かな? 先読みされちゃうし。

Sat Feb  8 00:53:52 JST 2003

macro は途中まで書きました。置き換えをマクロが呼び出された
時点で cheap に置くと、それを解消するタイミングがない。
ここだけmallocしても良いが..

chptrsave はlistにする必要がある。list で良い。

やっぱりmacro levelを見て、自分と一致したassoc valueまで
手繰って置換するんでしょう。そうすれば、置き換える必要は無い。
ということは、local_define にmflagsを格納する必要がある。

   c(a,b) =>  a=>"a", b=>"b"
        a=>"a" .. mflag == 1
   g(a,b) =>  (a=>"a+1+1",a=>"a+1"), (b=>"b+1+1",a=>"a+1")
        a=>"a+1" .. mflag == 2

macro のもとのnptr が残ってないと、オリジナルを返せない。オ
リジナルは、sc などが破壊されてしまう。ってことは、local macro
は、local table を汚してはいけないってことだよね。ってことは、
macro table は、もとのとは別に用意する必要がある。

#define c(a,b)  g(a+1,b+1)
#define g(a,b)  printf("%d %d\n",a+2,b+2);

main() {
   int a,b;                  a ... local
   a =1; b = 3;
#ifndef a
   c(a,                 a = "a".. macro mflag==1
                        g(a,
                               a="a+1"  mflag==2
                                  ^  a = "a" mflag==1
                        While replacing a in g's body, a should not
                           be replaced to  (original) "a", should be c's a.
      b);
   /* 3,5 expected */
#endif
}

うーむ。ややこしい。

    main()
	c(a,b)    mflag++
                         a=>"a" mflag ==1
           g(a,b) mflag++;
                         a=>"a+1" mflag ==2
                             ^ is replaced by c's "a" not g's a;
いったん mflag level n で展開したら、それは mflag level n-1 となる。

Sat Feb  8 18:13:43 JST 2003

いちおう、mflag まではデバッグしたが....  mflag を戻してないんじゃないの?

     ---c(a,b)-----------------------  mflag ==1
          a=>hoge, b=>hoga (mflag==1)
        ----g(ac,bc)-----------------  mflag ==2
              ac=>goge, bc=>goga(mflag==2)
            ----printf(a,b)----------  mflag ==3
                a=>poge, b=>poga(mflag==3)

g が呼び出されると、ac,bc は mflag==1 でのみ置換される。

あるテキストを置き換えると、それは置き換えたマクロのmflag level
(つまり一つ少ないレベル)になる。
置き換え終ったら、元のlevelに戻す。

mflag==2のlevel では、mflag==2のlocal macroの展開しかしない。

置き換えると、mflag level 1 になるので、そこで mflag==1 のlocal
macro を展開する。mflag==0 は常に展開を行う。

Sun Feb  9 11:35:23 JST 2003

うーん、なんかtypeが、list とCHARなどと入混じっているじゃん。
    int save = chptrsave;
で、chptrsave が、$chptrsave になってしまう。

Sun Feb  9 22:33:36 JST 2003


#define car(e) (heap[(int)(e)])
#define cadr(e) (heap[((int)(e))+1])
    car(cadr(e))

だろ。
    car ->
       #define e cadr(e) (mleve=1)
    cadr ->
       #define e e (mleve=2)

むぅ。これ、うまくいかないんじゃん。こまったなぁ。

#define c(a,b)  g(a+1,b+1)
#define g(a,b)  printf("%d %d\n",a+1,b+1);
   c(a, b);

こっちもだめじゃん。ふーむ。lisp interpreter のように
作ればいいはずなんだけど。

Mon Feb 10 08:10:25 JST 2003

結局、list base のinterpreter を実装しました。きちゃないが。
前の方法でも、頑張ればできるんでしょうけどね。

Tue Feb 11 13:50:03 JST 2003

struct copy だけど... 関数がstructを返すときに、引数に前もって
積んでおくのでは、そこに値がコピーされてしまうし、あとで、
スタックをたたんで置くときにきまずい。

function call の時に、引数の型のチェックをしてない

type に -1 とheapの引数が混在しているやつだけど..
やっぱまずいんじゃないか?

temporal struct は再利用できるんだけど、dispの変更ができないので
新しく作るしかない。大きいときだけ新しく作るなんていうセコイ
技はあるけど。(そうすると、帰って来た値へのポインタを使えなく
なるが.... 別にいいよね。戻り値それ自身を直接 return する
時もだいじょうぶなはず)

結局、呼出側で、領域を確保して引き渡すことにしました。この方法だと、
代入のときに二度コピーする必要もない。

register  を使用しているかだけじゃなくて、実際にcreg/dregに
値があるかどうかを記憶する必要がある。

Wed Feb 12 11:09:22 JST 2003

それだけどさ... やっぱりアドホックに実現するのは難しいんじゃないの?

まぁねぇ。register の場所の確保と、寿命は別だから、それで
いいんだけど、regs flag だけでなんとかならないのかな。
こういう変更ははまるが虚しい。

Thu Feb 13 18:37:36 JST 2003

さて、そろそろ jump  にとりかかりますか。

構造体の引き渡しのシークエンスに使う局所変数の位置がgccと違う...

そろそろ register は構造体にすべきだね。
    struct register {
        int used;
        int valued;
        char *name;
        char *wname;
        char *bname;
        int type; /* register variable or not */
        int number;
    }
virtual/real は、どうする。

Sat Feb 15 14:00:03 JST 2003

fdecl_struct を構文的に引数が出現するときに行うと、int *f(int
a) などで、* の評価が終る前に、int aが評価されしまう。*obj
のobj を評価し終らないとfのタイプが確定しない。int*f()[] み
たいな場合があるから。(?) なので、gcc と、そろえるためには、
arg の先頭で fdecl_struct を行う方法ではだめで、fdecl 中であ
とから修正する方が良い。

fix しようにも引数リストなんて、存在しないじゃん!

varargs を実装するのはめんどくさかろう...

rvalue(expr(),type) では、expr() のtypeをrvalueに引き渡せな
い。でも、type を大域変数にすると、rvalueを異なるタイプで呼
び出すときにtypeを変更する必要がある。このrvalueのtype の扱
いは、かなりはまったことがあるので、rvalue(int e,int type)の
方が良いことは確かなんだが...

struct_push のregisterの扱いが複雑すぎ。なんか、もっと
簡単にならないの?

Sun Feb 16 07:58:23 JST 2003

代入しなくて良いからと言って、ソース
のリストから除いては、上書きを防げない。

Sun Feb 16 22:55:58 JST 2003

vdisp ってなんだったんだ?

Mon Feb 17 12:35:39 JST 2003

並列代入は出来たみたい。代入は小さいものを先にすべきなのか?
まぁ、できりゃいいんだけど、横に避けるものが大きいのはいや
だよね。

Tue Feb 18 11:56:10 JST 2003

overlapped 用の emit_copy
float/double
long long

Tue Feb 18 19:34:31 JST 2003

code argument の符号を反転させると、list2(LVAR,offset)
のoffsetがアドレスの方向と一致しているという前提が
崩れる。それで、構造体の格納順序がずれてしまう...

ということは... def(n) でcodeの時はargumentは、局所変数と同じ
扱いでマイナス符号で処理した方が良い。

できたみたい。でもさ、

int main( int ac, char *av[])
{
    int n;
    goto arg1(0,1,2,3,4,return,environment);
}

って、きっと return 文がないと、文句を
言われるよね。むむむ。

post processing する時にoverlapしてないという保証がない。

Wed Feb 19 15:38:55 JST 2003

自分自身とのoverlapを見てないので、
    struct a a,int i
    int i,struct a a
みたいな時に自分自身を壊してしまう。なので、emit_copy
が、ちゃんと方向を見て壊さないように処理する必要がある。

call bcopy でいいじゃん。まね。

Wed Feb 19 20:42:07 JST 2003

楊さんの C2CbC と CbC2C を、micro C に取り込む。各所に、
conv->func(); を埋め込む。conv は、構造体。

    conv:   original
            c2cbc
            cbc2c

とする。なるほど。

Thu Feb 20 05:34:58 JST 2003

むぅ。code-ia32 で結構はまった。あと、stack のアライメントが
ずれるみたい。6809では問題にならなかったんだけどね。
leave で調整するべき。


Thu Feb 20 14:42:46 JST 2003

c2cbc,cbc2c なんだけど、いったん、構文木にしてから変換すると、
結構失われる情報があるけど、いいの? 特に局所変数の名前とか型
の情報とか。macro もそうだけど。 indent ぐらい保存できないか
なぁ。式の途中でfunction callする場合も取り扱う必要があるの
で、構文木にしてから計算するしかないかな。gexpr の代わりに生
成するようにするか。そうすると、修正するのは、statement と、
gexpr になる。でも、結局、構文木で型を持ち歩くしかないんじゃ
ないの? やっぱり変だよ。型の情報がないのは。

そうではなくて、exprN() で変換していく方法もある。この方が
情報が欠落しないので楽だろう。そうすると、修正するのは、
    exprN(),doXXXX()
となる。これは、量は多い。けど、まぁ、それだけ。この方が
オリジナルを保存しやすい。

中間変数を途中で追加すると、宣言部を前もって出力できなく
なる。{int a;...} を認めれば良いわけだど。実装は難しくない。
じゃ、やれば? でも、汚くなるなあ。出力をいったんバッファ
に貯めれば? どこに? cheapp ですか? 中間変数はいらないん
じゃないの?
     a = g(i)+a;
でしょ。
     goto g_1(i,f_1,save_a); }
     code g_1(i,f_1,save_a) { .... goto f_1(ret_value,save_a); }
     code f_1(ret_value,save_a) { a = ret_value+a; ...}
じゃん。いらないじゃん。。


型を表示するルーチンが必要だね。

めんどくさいなぁ。CbCのProlog version とかほしいなぁ。そうすれば、
変換は簡単。でも、やろうとしてできなかったことでもあるな。


Thu Feb 20 21:13:23 JST 2003

MC6809 の mc-codegen.c version は? (ちょっと虚しすぎる?)
X と D で、use_data_register, use_pointer してやる。
tosop で、X と D の間の足し算を特別扱いする。
(なるほど...) MAX_MAX=0でうまく動くのか? やっぱり、1は
いるよね。できれば、2だよね。

結構、浮動小数点も簡単かも。

汎用の書き換えツールも便利そう。

でも、Prolog version ってのも面白そう。
   code(name,interface(....)) :-
     p()....,goto(name,interface(....)).
みたいな感じ? 結構、簡単にinterpreterを書けるかも知れない。
これは、あれだね。thread diagram interpreter と似ている。

Fri Feb 21 13:34:17 JST 2003

構文要素での書き換えだけど、どれくらいの能力があるの?
その場での書き換えだけだと、ちょっと低すぎない? それで、
cbc2c,c2cbc はできるとは思う。

まぁいいけど.. chk を無視しているところが結構あるんですけど。
jmp,enter,leave ...

Sat Feb 22 13:05:04 JST 2003

type の印刷かぁ...

conv 系は大半はdefault convが呼ばれる。なので、c.c
っていうよりは、default.cだよね。必要なところだけ、
自分で代入すると言う方法が良いだろう。その方が
ヘッダも一つで済むし。もちろん、object 指向なら
簡単なんだが...


Sun Feb 23 19:47:41 JST 2003

struct のtypeを印刷するんだけど、一回印刷したら、あとは印刷
しない方が良い。逆に毎回書くなら、tag名type名は、いらないの
か。

とするとtypeの解釈はやめてndeclで処理する? 印刷では、それで
いいわけだけど。

このタイプの印刷だと再帰型は印刷が終了しないんじゃないか?
しないね。

Mon Feb 24 02:31:06 JST 2003

strings の\nなどを元に戻す必要がある。

なんか括弧がわやになってるな。

Mon Feb 24 11:02:07 JST 2003

typedef されたタイプは、そちらを使う方が良い。けど、情報が失
われてしまっているので、どこかにとっておかないとだめだね。dsp
?

うーむ、これはなかなか難しい。全サーチしてもいいんじゃないか
な。遅いけど。少なくともgnptrで定義されたものはサーチすべき
でしょう。

indirect function type の表現がなぁ....

sdecl ではconv を行うので、type_print ではsdeclを経由した場
合に表示を行ってはいけない。

なんか関数の引数の型の値が微妙に変わるんですけど... やだなぁ...

まだ、関数定義のtypedefがstructに変わってしまう。gtypedefed
がうまく動いていない?

Mon Feb 24 17:24:31 JST 2003

まぁねぇ。やっぱり完全に構文木から再構成した方が
便利ではあるよね。特に getsym (空白など)と conv->x_()
との総合作用はめんどくさい。

そのためには、局所変数名をtree上で持ち歩く必要がある。
まぁ、そうすれば良いだけだけど。

実際、今のセットで出来るかどうかは、ちょっと怪しい。
たぶん、buffer に出力するってのをいれればおそらくは
変換できるだろう。

式の途中での呼び出しとかを考えると、やっぱり
構文式から生成しないとだめだろうね。
(ってことは、まだ、かなりの作業があるってこと.... むぅ...)
tmp2.c は、通らないし...

Fri Feb 28 20:32:46 JST 2003

で、c2cbc は、途中で float の方を先にやるわけ?

Sat Mar  1 22:05:43 JST 2003

creg_destroy は、ぜんぜんだめ。これは基本的なアイデアがだめ。

long long はstructでいいんじゃない? だめ? で struct 演算を別に
定義してやる。これは、実装にもよるか。

float,long longなんだけど、
    FRGVAR DRGVAR LRGVAR
などを作る。さらに、
    FMUL DMUL LMUL
などもいる。型の変換は binop で解釈する。変換も演算になる。
    D2F, D2I, F2D, F2I, I2D, I2F, U2D, U2F
ぐらいですか?

emit_pushは、型を必要とするけど? そうだねぇ。emit_fpush, emit_dpush
かな?

creg にfloat register(or stack) の値を入れればいいんじゃないの?
それを見て、emit_pushの型を決める。creg は、けっこう、いろんあ
ものが見ているので、いじらない方がいいじゃないかなぁ。
そうね。FMULとかがあるなら、それで判断できそう。

構文木には型を含めないってのは不便。型を入れれば? そうすれば、
    RGVAR CRGVAR FRGVAR DRGVAR LRGVAR
ではなく、
    RGVAR
ですむし。その方が変形も楽だしね。型は、
   CHAR,UNSIGNED, UNSIGNED CHAR, INT, FLOAT, DOUBLE, LONGLONG
ぐらいですか。

emit_data

とすると、書き換えが結構あるけど。

Sun Mar  2 12:58:38 JST 2003

あとはconstantだね。FCONT,DCONSTかな。binopでは
変換とかも必要なわけだけど。

そういえば、shot のload/storeもないね。SRGVAR,SASSとかですか? SASS
は、すでにあるなぁ。

Sun Mar  2 22:01:58 JST 2003

あれ?
       conv->_sm();
       (*conv->_sm)();
の場合は、
       *conv->_sm の値へcallする
んだけど、
       goto exit1();
       goto (*exit1)();
の場合は、
       exit1
の値へjumpするんだよね? およ? なんか勘違いしてる? なんでexit1()
だとindirectが出て、(*exit1)だと出ないんだろう?

この宣言は、
    void (*_sm)();
であって、
    void _sm();
はできない? なんで?

あぁ、まぁ、いろいろ、めんどくさい。

やっぱり、arglist の再帰的扱いがちゃんとしてないとだめ。

うーむ、 enum なんてのもあるのね。やさしいけど、いるのか?

code (code *) * みたいなのがあるので、conv は手直しが必要。

Mon Mar  3 12:38:08 JST 2003

float/double は順調に進んでるけど、3日はかかるでしょう。

binop を書いちゃうとmc-parse.c は、ほとんど終り?!
代入と関数呼び出しが残っているか。あと single もあるね。

emit_push base で書くんだけど、他のCPUではだいぶ様相が
違うんだろうな。

dreg/creg のfloating versionが必要です。( です? )

Tue Mar  4 14:56:28 JST 2003

double のcurrent register は387のスタックを使う。(?)
関数呼び出し時に387のスタックが保存されるという
保証は無いので、emit_dpushでは、%esp に保存する。

でも、そうすると、代入の後などで387のスタックが
常に残ることになる。こいつをクリアするコードは
どこにいれる? free_register でもいいんだけど....
ううーむ、つかいずらいやつ。ld じゃなくて、
stack top に代入するオペレーションはないの?

(あぁ、でも、なんか、floatは、もうすぐ終っちゃうな... なんか、
さびし...)

Tue Mar  4 23:58:07 JST 2003

fmulp とかでは、fpp のstackのつじつまはあう。fstl とかだと、
合わない。fstpl すればいいんだが、そうすると連続代入でまずくなる。
値を使うかどうかを代入時に知ることができれば良いんだが。
(use flag で判断することにした)

結局、freg は、使わなかったね。0が、入っているので直さないとまずいか。
fregを見て、stack を直すってのは、やっぱり、まずいよな...

でも、浮動小数点レジスタを持つCPUの場合はいるんじゃないの?

Wed Mar  5 11:25:11 JST 2003

printf では 引数はdoubleで統一する必要がある。goto() では、
それをするのはまずい。局所変数と同等だから。ってことは、

関数の引数はdoubleにしないとだめなのね。プロトタイプが
ある時は、その限りでない。(うーむ...)

   (くそ、こいつの副作用が結構出るな...)

あと、fpp のスタックに頼っているので、overflowした時に
困らないか? ほとんどの場合でだいじょうぶだが、だめだった
時にerrorぐらい出せば? でも実行時にしかわからないか...

I2D でさ、signed/unsigned の区別がいるね。

やっぱり FCONST いるんじゃないの?

Wed Mar  5 19:51:59 JST 2003

副作用以外は終ったけど.... あと、name space が結構重なっている
んだよね。
          struct tag, struct field
が重なっているのは結構うっとうしい。gsearc/lsearch のあたりも
書き直さないとだめかも。

あと、list もなぁ。mode の作り方にもよるんでしょうけど。

あと、結構、汚いよな...

Wed Mar  5 21:15:34 JST 2003

できたよ。まだ、テストしてない部分はあるけど。局所変数の初期化とか。
FCONST とか。3日で出来たね。

(gcc の方をやった方がいいかなぁ...)
 goto.c が通らなくなってるな。

Thu Mar  6 14:00:13 JST 2003

PowerPCのnon-lazy pointerって、テーブルに入っていてそれを読
み込む形式なのね。いったん、レジスタに読み込んだら、それを再
利用する形が良いらしい。ということは、code_gvar にキャッシュ
を作らないといけない。しかも RLU ですか? (めんどくさ～)
でも、そうしないと、
   i = i+1;
なんてのでも、ひどい目にあってしまう。

local variable も最初に move multiple register で大半は
レジスタに読み込んじゃうみたいね。pointer で参照されると
困るんでしょうけど。まぁ、31個もあれば、そういうことを
してもあまり問題ないのかも知れないけど。

creg を破壊しない実装にすれば、少しはましになるんじゃない?
(IA32では、それは難しいけど)

Thu Mar  6 20:50:24 JST 2003

やっぱり、使った分だけregisterを保存するようなコードに
なるみたい。one path で、それをするためには、
        .align 2
_main0__:
        lwz r5,2136(r1)
        addi r1,r1,2128
        lmw r23,-36(r1)
        mtlr r5
        blr
        .align 2
        .globl _main0
_main0:
        mflr r2
        stmw r30,-8(r1)
        stw r2,8(r1)
        li r11,0
        stwu r1,-480(r1)
        li r2,100
        mtctr r2
        mr r30,r3
        addi r0,r1,64
        mr r9,r0
        b _main0__;
とかいう感じにするしかないね。

あと引数は、レジスタに積むようになっているみたいだけど... r3 から?

        mflr r31
        li r0,7
        stw r0,56(r1)

だから8個まではレジスタに積むみたいね。
r3-r10 だね。

構造体もregisterにコピーされるのか。そして、向う側で受取の
コピーを行うわけだね。先頭にreturn structへのポインタがあるのも
同じ。

(うう、memcpyしまくりだ...)

浮動小数点もレジスタ渡し見たい。f1から。(なるほど)

saveFPってのを呼び出して、 f24-f31をsaveするらしい。
(31-24)*8 数合わないな?

pointer のことを考えると、レジスタだとまずいものもある
わけだけど。アドレスを取られてからで間に合うんじゃない?
配列などは、もともとだめだし。場所と値(?)は確保するとして。

そうか、逆に、r3-r10 は引数でなければ壊しても良いわけか。
(それでr9とか良く使われているわけか...)
ということは足りなくなったら、引数をセーブすれば良いわけね。
(ってことは、LVAR かつ REGISTER っていう状況があるんじゃん...
まぁ、そうだけどさ...)
これは get_register がめんどくさそ。

どうも、r11-r12  あたりは自由に使っているらしい。

引数を作っている途中で関数呼出しするときは、どうするの?
r30などに移動するのか?

なんか知らんけど、in file call name と out file call name が
違うみたいね。(sigh...) こんなのなんとかなるのかなぁ。
全部、stub にしておいて、.set で書き換えるという手もあるけど。

(さすがに一日ではできないか...)

なんか整数から浮動小数点への変換はじぶんでやらないとだめなのね。
これはサブルーチンを呼んだ方がましだ。

get_register は絶対失敗しないようにできるんじゃないか?

label があると、code_base cache はclearしないといけない。
それを判断するには fwddef をhookする必要があるけど。

Fri Mar  7 09:17:10 JST 2003

問題は、
       register allocation
と
       function call/goto call
の構成だな。goto の方は machine dependentなところは
ほとんどない。register のsaveさえ必要ないから。

register allocation だけど。
     r0
     r1      frame pointer (or stack pointer )
     r30     jj
     r31     relocation register
     r0,r1,r2    システムで使う
     r0-r10  引数
             引数でないところは優先的に使う
     r20-r29 セーブして使う領域

r10-r19 はどうなんだろう? セーブしないのか?

ia32 の方でもfppのスタックを関数呼び出しのときに吐き出した方が
良い。

r0 r1 r2 r3 r4 r5 r6 r7 r8 r9
r10 r11 r12 r13 r14 r15 r16
r28 r29 r30 r31

なので、もののみごとに、17-27 までが使われてないね。

ということは、関す呼出し時には、保存されるレジスタはないと
思った方が良いってこと? あるいは、r17-r28 は保存されると
思って良いのかな。

Sat Mar  8 19:28:42 JST 2003

関数呼び出し時のレジスタセーブを避けるためには、関数呼び出し
を優先して実行してやれば良い。関数呼び出しの結果は局所変数に
セーブする。
     f(g(h(a)+1)+2)
は、
    a1=h(a)
    a2=g(a1+1)
    f(a1+2)
となる。そうすれば、関数呼び出しのときのスタックはかならず0になる。

でも、結局、引数は関数呼び出しの前にセーブするのね。だったら、
そんなことしないで、セーブすれば良いのか。

Mon Mar 10 11:42:40 JST 2003

で、レジスタのセーブなんだけど、mc-codegen.c を変更しない
とすれば、引数のリストを使って変更していくのが良い。
関数呼び出しは基本的には並列代入になる。並列代入でき
てもできなくても、セーブする必要はある。今の並列代入
ルーチンのできは良くないので、「同じかどうか」だけ
判断するのが良いのではないか?

関数呼び出しの前に式用にレジスタに積まれた値はセーブした
方が良い。セーブした後はlvarとしてアクセスすることになる。
スタックでもいいけど。
そうすると、stack 配列には、

     レジスタ   レジスタ番号 (>0)
     スタック   -1
     lvar       lvar番号

の三種類が入ることになる。それに合わせてtosop/assopを書き直
す必要がある。emit_pop だけでいいかも。スタックを止めちまう
のも手ではあるが、ia32の方で効率が悪い。やっぱり三種類サポー
トするのが良いだろう。

(けっこういろいろあるなぁ... どこから手を付けるか...)

Tue Mar 11 14:23:57 JST 2003

save_stacks すると、レジスタはほとんど使われなくなって
しまう。が、コードの見通しは良くなる。

定数を右辺に持って行くとsave_stacksでsaveする量が減る。が以
外にめんどくさいね。反射律が成り立たない演算子に関しては。tosop
の定数版とか作ることになるので... あとスタックに積む順序が逆
になってしまう。まぁ、もとの版では行われていたことだが...
CMPではrexpr で反転して論理を逆転させる方が簡単か。SUBでは、
ADD + (-CONST) にする方が良いね。

      je _xxx
したあと、current register のregv[]が残ってしまう。これは、
変だよね。gexpr_init で regv が残るのは、case 文の比較だけ。
あとは全部0にして良い。(まぁ、害は無いんだけど)

(case 文のjumpは、switch 文が終る時に処理すれば、index jump
にすることができるね)

Wed Mar 12 12:58:47 JST 2003

比較で入れ換えるとの否定は若干違うよね。

Thu Mar 13 19:39:48 JST 2003

そういえば、doif で条件が定数だったときとかの最適化は
してないんだね。やさしいけど。chk を使えば良いので。

   f(g(1,2,3),g(1,2,3),g(1,2,3))

とかだと、結局、g の返り値は一旦メモリに入れないとだめじゃん。
なんだけど、実際は、r29-r22 を使っているようですね。

ってことは、function call の時に、r3-r10 が前の引数かどうかを
チェックして、引数だったらr29-r22に移す作業がいるわけだよね。
いったんr3とかに入れてしまった後だと、重複してしまうが...
前もって関数呼出しがあるかどうかは、調べることができるから、
関数呼び出しがあったら、そうするようにする?

いろいろめんどくさいなぁ... (いったい、いつなったらできるんだ?)

Fri Mar 14 10:38:25 JST 2003

function の dsp が、arglist と extern flag の両方を入れてしまっている。
本来は sc で区別するべき物だよね。

なんか、emit_pop_free のxregがLVARの時のバグを取るのに苦労した...
gdb は top level でのwhile を受け付けなくて、define してやなんないと
だめみたいね。

Fri Mar 14 15:50:28 JST 2003

なぁ... 書いても書いても書いても、終らん!

Fri Mar 14 19:43:44 JST 2003

jump の中で input register を割り振るときに floating point register の
ことを考えてなかった。これは  register_var とは異なるので異なる
仕組みで割り振る必要がある。ってことは、get_input_register_var
が要るってこと?


0x9001a544 <saveFP+4>:  stfd    f15,-136(r1)
0x9001a548 <saveFP+8>:  stfd    f16,-128(r1)
0x9001a54c <saveFP+12>: stfd    f17,-120(r1)
0x9001a550 <saveFP+16>: stfd    f18,-112(r1)
0x9001a554 <saveFP+20>: stfd    f19,-104(r1)
0x9001a558 <saveFP+24>: stfd    f20,-96(r1)
0x9001a55c <saveFP+28>: stfd    f21,-88(r1)
0x9001a560 <saveFP+32>: stfd    f22,-80(r1)
0x9001a564 <saveFP+36>: stfd    f23,-72(r1)
0x9001a568 <saveFP+40>: stfd    f24,-64(r1)
0x9001a56c <saveFP+44>: stfd    f25,-56(r1)
0x9001a570 <saveFP+48>: stfd    f26,-48(r1)
0x9001a574 <saveFP+52>: stfd    f27,-40(r1)
0x9001a578 <saveFP+56>: stfd    f28,-32(r1)
0x9001a57c <saveFP+60>: stfd    f29,-24(r1)
0x9001a580 <saveFP+64>: stfd    f30,-16(r1)
0x9001a584 <saveFP+68>: stfd    f31,-8(r1)
0x9001a588 <saveFP+72>: stw     r0,8(r1)
0x9001a58c <saveFP+76>: blr

なのか。ということは、
      f%d に対して、"saveFP+%d",68-(31-f)*4
かな?

うーん、これで、全部書いた気がする。でも、ほとんど全部の
関数にバグがあるだろうなぁ。一つ一つ取っていくしかないか。

Sat Mar 15 16:04:09 JST 2003

やぁ...  まぁ.... バグだらけだな。

function call のレジスタの処理がでたらめ。RISCの場合は、parallel_assign
した方がいいんじゃないか?

Sun Mar 16 20:59:10 JST 2003

あぁ、まだまだ、かかりそうだ....

定義されてない関数/定数をextern扱いにする必要がある。(なんで、PICなの?)

function は c0(n->ty)==FUNCTION で識別する。n->sc には、FUNCTION/EXTRN[1]
が入る。だよね。(CODE)も。だけど、n->ty に戻り型が入っている場合が
けっこうあるらしい。

(しかし、これは、結構かかるな...)

Mon Mar 17 12:02:22 JST 2003

function のnptrだけど、
    nptr->ty  function の return type
         list3(FUNCTION,return_type,arg_type_list);
    nptr->sc  本来はFUNCTION/CODE (EXTRN/EXTRN1)
    nptr->dsp 引数のリスト
と言う構成なわけだよね。で、引数のリストとtypeは重複している。

他のnptrとの整合性を考えると、
    nptr->ty  return type
    nptr->sc  FUNCTION/CODE
    nptr->dsp 引数のリスト
が良い。で、引数のリストにEXTRNの情報を入れる方がいいんじゃないか?
(どっちにするんだよ...)

プロトタイプと実際の引数リストの整合性はチェックしなくちゃ
いけないわけだから、別な方がいいんじゃないか? とすると、
やっぱり前者か...


extern と、そうでないものとの呼出しを、呼出しの時点で
区別しないといけない。しかし、prototype で定義されている
ものと default extern の区別は、最終の時点でしか判別できない。
できないよね。定義されてないものが default extern なんだから。
ってことは、最後に、.set で定義するしかないか。(sigh...)

Mon Mar 17 14:34:12 JST 2003

えーと、input register に regv/regs をセットしないとだめ。
関数呼び出しの引数を評価する前に save する必要がある。
さらに、引数の評価の後に、save された変数を呼び出す必要が
ある。(ってことは、いままでのは、まったくのでたらめか..)

register 変数の場合は、問題ない。ってことは、ia32 側も
変更してしまったので、おかしくなっているね。もっとも、
code の場合は、そういうsaveとかは必要ないから良いのか。

(11日目か...)

    mr creg,hoge
    mr hoge2,creg

とかは、g_expr_u で最適化するべし。set_freg/set_creg でレジ
スタ変数に割り振ると、set_freg でfreeされてしまう。

浮動小数点定数の共有はやった方が良い?

input register のsaveを忘れている。
input register の割当が逆順。

Mon Mar 17 23:38:14 JST 2003

あぁ、そうか。input-register のアドレスを取ったときは、
それをLVARに変えないとだめ。

なんだけど、途中で分かっても、loop で前に戻ることがあるので、
手遅れです。ということは、one path ではできないね。

むぅ... function call の save_input_register も同じ「手遅れ」
の問題があるのね。function argument は、すでに parse されて
いて、その引数は、register に固定されてしまっている。
save_input_register で、save するコードを出しても、
そちらを見るようには出来てない。(どうすればいいんだ?)

function callの先頭で、引数を全部stackにsaveしてしまえば、
このあたりの問題は解決する。けど、あんまりな気もするね。
でも、stmw も使えるしな...

結局、input_register は、LVAR のまま処理して、可能ならば
register を使うって方がいいんじゃないかなぁ.... でも、
そうすると、今まで書いたコードは、ほとんど無駄かぁ...

いずれにせよ、あんまり簡単な解決はないね。

Tue Mar 18 10:46:48 JST 2003

結局、全部 stack にsave しました。そうすれば、変更は1行。

やっぱり、関数全体を構文木に落してからgexprするべきだよね。
それ自体は、そんなに難しくないが。

Tue Mar 18 12:41:42 JST 2003

COND(三項演算子)で使うレジスタが関数の引数を破壊してしまう。
input register にならない値を使えば良いんだけど。r15
を使っているんだけど、それでいいの?

virtual を使っていたときは、use_register で何も破壊されなかった
んだけど、使わないとすると、結構破壊されてしまう。なので、
ちょっと奥の深い問題かもね。三項演算子の型はチェックしてなかったし。

まぁ、それは、一時レジスタを使えば良いとして...

時々呼び出す、u2d とか bcopy とかで破壊されるinput レジスタ
はどうする? これは、予測は困難だよね。使う分だけsaveするって
言う手もあるけど。うー、どうしよう... 検出できるようにするっ
ていう手もある。(と、思ったら、get_register_var が間違ってい
るみたいね) 検出はちょっと重いか。二乗のアルゴリズムは、あま
り使いたくない。といっても、定数乗になるだけか。呼出側でsave
する? bcopy がどれくらい使うか割りと曖昧。

もっと積極的にget_register_var するっていう手もあるよね。そ
うすれば、あまり気にすること無く library call できる。(ちょ
っと、書き換えが多いが...) その方が筋かな。使うレジスタを減
らそうと思うと、それは検出するのと、それほど差はないわけか。

このあたりも構文木を全部持っていれば解決できるんだよな。

うーん、まだまだ、だな。

関数が関数呼び出しで決まる場合の input register の破壊を考えて
ませんでした。これも、どうすればいいんだ... まぁ、get_register_var
するのが簡単だよね。

save register が狂っているようだね。max_register_var あたり?

Wed Mar 19 02:22:51 JST 2003

なんだか、struct のtag listが、int a,b,c; のようになっているのを
一つと数えているらしい。困ったものだ。前に言ったのをちゃんと
実装しよう。

macro のバグも見つけちゃったよ... むぅ。

でも、とりあえず、a.out は動きました。

Wed Mar 19 12:59:01 JST 2003

なんか、浮動小数点をprintfに引き渡すときは、rnレジスタにも
値をいれていて、しかも、そっちを見るみたいね。これは、
めんどくさい....
   r4,r5   ... f1
   r6,r7   ... f2
   r8,r9   ... f3
   f4 からは単独
(あぁ、なんか、これは異常にめんどくさいぞ... こんなことするなら
f0 から r0 にコピーさせてよ...)

40(r1)とかをprintfは、派手にぶっこわすようですね。いったい
どれだけ取れば良いんだろう?

-112 ぐらい? 今は-72程度か。

(なんか風邪ひいた... 家内がくるというのに...)

浮動小数点のバグも順調に取れています。

なんか、save_stack が余計なsaveしてない?
まぁ、一時変数を良く使うのでfree listを作った方が良いかもね。

その前に整数演算のチェックが必要だな。

Thu Mar 20 12:06:27 JST 2003

まだ、save したレジスタを破壊しているな。
    set L_98,244
    stw r15,lo16(-44+L_98)(r1)
ぐらいで、もう壊れちゃうみたい。ってことは、L_98 がもっと
大きくないとダメなのか。


Thu Mar 20 23:43:42 JST 2003

ようやっと、self compile が通りそう。register save 系が
やっぱり難しいみたいだね。dynamic loader を壊したりするし。

あとmodがおかしいみたいで、hashの値が違うらしい。マイナスの値
になるunsignedのかけ算ねぇ。int.c のrecursionが通らない。
まだ、offset がおかしいらしい。

macro のバグもとれたし。

一応は、self compile は通りました。

Fri Mar 21 03:18:26 JST 2003

やっぱり、r1 と x(r30) の計算が合わない。きっと、
呼出側で、引数の分のoffset を用意しているのだろう。
だから、どれくらいの引数の関数を呼び出したかという
値がいるのではないか?


Fri Mar 21 12:22:11 JST 2003

                       <------r1_offset------------------------------>
                                      <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
      caller arg   xx   register save   local      callee arg     xx
                          reg_save      disp       max_func_args*size_of_int

ということだったみたいね。ようやっと self compile が通りました。

free_glist を作るか....

Sat Mar 22 11:17:41 JST 2003

creg/freg を g_expr の引数にした方が、レジスタマシン系では、素直な
みたい。そうすれば、
##              conv->static_();
        addis r15,r31,ha16(_conv-L_242)
        la r15,lo16(_conv-L_242)(r15)
        lwz r3,0(r15)
        lwz r3,244(r3)
        mr r29,r3
        mtctr r29
みたいな mr は減るね。もっとも一命令だけどさ。3% もあるみたい。
ちょっと多いか... 386 での use_register もなくなるしなぁ。
(あぁ、でも大半はポインタキャッシュだな。こっちを直す方が
簡単か)

まぁ、そういう最適化をしないっていうのが、このコンパイラの立場
なわけだけど。


構造体の引数渡しでは、構造体そのものをレジスタに載せて
引き渡しているみたいだね。まったく... それで、あわてて
メモリに代入しているわけか。

なんか  mtctr r2; bdn Lxx とかいうのがあるのね。main frame っぽい!
これはベンチマーク用って感じだね。


Sun Mar 23 16:06:29 JST 2003

Breakpoint 3, get_register () at mc-code-powerpc.c:235
235         for(i=MAX_TMP_REG;i>MIN_TMP_REG;i--) {
(gdb) c 9999
Will ignore next 9998 crossings of breakpoint 3.  Continuing.
test/basic.c:67:Bug of compiler

Breakpoint 2, errmsg () at mc-parse.c:214
214         if(lineno==0) return;
(gdb) info b
Number Type           Disposition Enabled Address    WhatStackFrame Condition IgnoreCount Commands
2      breakpoint     keep        y   0x0000ca08 in errmsg at mc-parse.c :214
        breakpoint already hit 1            time
3      breakpoint     keep        y   0x000028e4 in get_register at mc-code-powerpc.c :235
        breakpoint already hit 69           times
        ignore next 9930      hits
(gdb) run
The program being debugged has been started already.
Start it from the beginning? (y or n) y
Starting program: /Users/kono/src/device/mc -s test/basic.c
[Switching to process 24650 thread 0x2307]
test/basic.c:67:Bug of compiler

Breakpoint 2, errmsg () at mc-parse.c:214
214         if(lineno==0) return;
(gdb) c 69

うまくいかんね。

a+a+a....a で落ちてしまう。まぁねぇ。

結局、stack frame の問題か。

Mon Mar 24 03:06:32 JST 2003

Intel 側にもだいぶ embug してしまったようだ。

basicとかfloatの難易度を上げすぎたか?

mc-code-power.c のlvar は、
     input arg > 0
     local var < 0
     output arg > ARG_OFF
とするべきだね。

Mon Mar 24 12:08:43 JST 2003

        addi r27,r1,56
        addi r29,r28,28
        mr r3,r27
        mr r4,r29
        li r5,372
        bl L_memcpy$stub
        lwz r4,0(r28)
        lwz r5,4(r28)
        lwz r6,8(r28)
        lwz r7,12(r28)
        lwz r8,16(r28)
        lwz r9,20(r28)
        lwz r10,24(r28)
        mr r3,r28
        bl _main3


うーむ、最低な奴。最初の28byteだけレジスタ渡しなのか。アドレス
は変わらないんでしょうけど。まぁ、合わせなくても害は無いけどさ。
そのうちね。(そんなに難しくは無いが... また、function が複雑
怪奇になるな) しかし浮動小数点レジスタも使うとかそんなんじゃなくて
良かったかも。


        stwu r1,lo16(-L_9)(r1)
とかしているから、局所変数は64k以内ってことだね。haしてもいいんだけどさ。

Mon Mar 24 17:07:59 JST 2003

さて、ようやっと fact-a.c に取り掛かれるわけだけど、今のままだと、
    input register -> メモリへのsave
ってのがあるんだよね。これはいただけない。sub routine call すると、
r0-r10 は破壊されちゃうし。ということは、code segment の引数は、
r29-r20 が良いんじゃないか? 浮動小数点f31-f20を含めて。

問題は、どこでinput register を指定するかだけど、get_input_register_var
で code 用かどうかを指定するのが良いかな。fnptr ではダメなので明示した
方が良いだろう。

r31, r1 の設定があるのはやむを得まい。r1=r30であった方が良いのだろうか?
その方がfunction calll の時の変更が少ないだろう。

メモリとinput register (この場合はr29-r20,f21-f20だけど)の対応は
どうする? 通常だと呼出側が確保するわけだけど、そうはいかないね。
レジスタもsaveする必要が無いから、いろいろ簡単でよろしい。

あとは、return/environment の扱いだけど。ia32 の方でもいろいろ
動かなくなっているようだな。

Mon Mar 24 21:56:47 JST 2003

うーん、別にフレームを変えないで、そのままでいいか。
その方が楽だよね。return しようと思うといちいち
frame をうごかさないといけないけど、return は
別処理するんだから、いらないか。

Wed Mar 26 14:29:21 JST 2003

で、フレームを変えないとすると、

                       <------r1_offset------------------------------>
                      *               <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
      callee arg   xx   register save ! local      caller arg     xx
                          reg_save      disp       max_func_args*size_of_int
        lvar>0                         lvar<0       lvar>0x1000 0000

なので、r1/r30 を常に移動させる必要がある。前のcode segment/
function がどこにr1/r30を持っていたかを知る手段はないので、
jump する前に糢とに戻す必要がある。r30が固定ならばr1のみの
修正で良く、前に戻す必要はない。

でも、r1_offset 分を戻せば良いだけなんだから、r30を * に固定
しても良いんじゃないか? ! でもいいんだけど。こっちの方が簡単
かな? code の場合は register_save は 0 (つまり、マイナス)な
わけだから。(まぁ、穴を開けておいても良いけど)

Intel の場合はどうして、こうしなかったのか? (でも、最後にチェック
した時にはcore dumpしていたが...)

                      ebp                        <-----esp----------->
                       <------r1_offset------------------------------>
                      *               <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
      callee arg   xx   register save ! local      caller arg     xx
                          reg_save      disp       max_func_args*size_of_int
        lvar>0                         lvar<0       lvar>0x1000 0000

というわけなので、* にそろえる方が Intel 版とも一致する。
ってことは、ebp の移動は Intel でもやっていたってこと?
いやfunctionではこうなっているんだけど、code では違う。


     ebp                                         <-----esp----------->
                       <------r1_offset------------------------------>
                      *               <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
      callee arg   xx   register save ! local      caller arg     xx
                          reg_save      disp       max_func_args*size_of_int
        lvar>0                         lvar<0       lvar>0x1000 0000

ってわけか。とすると powerpc では、

     r30               <------r1_offset------------------------------> r1
     #                *               <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
  xx  callee arg   zz   register save ! local      caller arg     zz
                          reg_save      disp       max_func_args*size_of_int
        lvar>0                         lvar<0       lvar>0x1000 0000

の#にr30を固定してr1をずらすことになる。やっぱ、こっちだよね。
zz はから。xx に、base  となる関数呼び出しが来る。から、
callee arg は破壊される。

どっちも可能だな。両方実装する? やっぱり後者からかな。gcc は
前者の方が簡単だろう。

入力変数をレジスタに割り振ってしまうと、その範囲では
簡単に動いてしまう。(そりゃ、そうだ...)

goto with environment で構造体を返すのには注意が必要。
どこでコピーする? goto した場所? return-continuation?
そうねぇ。return-continuation 側が普通でしょう。あぁ、
でも返し先は元の関数呼び出しの引数上だから壊れちゃって
いるかもね。だから、とっておく実装の方が良いわけね。

(なんか -O3 にすると、mc1 が落ちるな...)

Sat Mar 29 16:35:18 JST 2003

     r30               <------r1_offset------------------------------> r1
     #                *               <------------lvar_offset------->
 r+  +------------+---+---------------+----------+--------------+----+    -
  xx  callee arg   zz   register save ! local      caller arg     zz
                          reg_save      disp       max_func_args*size_of_int
        lvar>0                         lvar<0       lvar>0x1000 0000

このままだと、* が previous r1/r30 になるので、function から
goto する時に戻り番地やzzにあるはずのsaved r31/r30が破壊されて
しまう。それは、ちょっと困るということは、一旦、dummy subroutine
(普通はstub っていうか)を呼び出す方が良い? 戻り番地とprevious r1/r30
は持ち歩いているわけだけど... また、r20-r29はつぶされてしまう
ので、前もってsaveする必要もある。f31-f20も。(結構多いな...)

   #  *          r30 <--------------r1_offset-----------> r1
r+ +--+----------+----------+-----------+----------+----+
xx  zz  reg save !callee arg!code local  caller arg  xx
         r20-r29

これだと environment は持ち運ぶ必要はない? いや、ある?
逆に戻り番地を持ち運ぶ必要はなくなるわけね。そっちの
方がきれいかな。goto-continuation みたいな感じか。

返り側は、

  lwz r1,continuation
  lwz r1,0(r1)
  lwz r0,8(r1)
  mtlr r0
  lmw r30,-8(r1)
  blr

程度で良い? このr30ってのはgoto先では知り得ない。いや、待てよ、
この場合は、r20-r29って決まっているわけか。

  lwz r1,continuation
  set r3/f1 as a return value
  lwz r1,0(r1)
  lwz r0,8(r1)
  mtlr r0
  lmw r20,-148(r1) (?!)
  blr

で良いわけか。構文は同じでreturn addressは無視することにするか。
呼出側は、

  通常の関数呼び出し (引数0) (は、手間0だから..)
  bl L_stub_NN
L_return:        (普通のretrunもあるから、必要な場合がある)
  lwz r1,0(r1)
  lwz r0,8(r1)
  mtlr r0
  lmw r20,-8(r1)
  blr
L_stub_NN:
  mflr r0
  bl L_61
L_65:
  lwz r1,0(r1)
  lmw r23,-108(r1)
  b restFP+36 ; restore f23-f31
L_61:
  stmw r23,-108(r1)
  stw r0,8(r1)
  b saveFP+36 ; save f23-f31

ちょっと複雑すぎるかな。特に gcc では、こういう操作は難しいかも。

あ、そうか。register saveは、このy関数が呼び出された時点で
やってしまえば良い。そうすれば必要ない。戻り番地も既に xx
に入っている。だよね。

                 * gotoを呼び出した関数のr1 ! r1(goto前のr1)
   #             *                           r30<--r1_offset-------------> r1
r+ +----------+--+----------+----------------+-----------+----------+----+
    cousin arg xx  reg save !callee arg      !code local  caller arg  xx
                   r20-r29     lvar>0         lvar<0      lvar>0x1000 000
                   f20-f31  <-my_func_args--><--disp-----><-max_func_arg->
                              *size_of_int                  *size_of_int

とすれば stub は必要ない。cousin arg も保存されている。goto の
引数のみがlocal変数を上書きする形で格納される。これで、original
のIA32実装と一致することになる。(引数の保存を除いて。いや、
元のも保存されているんじゃないの?)

それで、code segment から関数呼出しするときは? (ってことは、
それようのテストも必要なわけか...)

Wed Apr  2 17:40:32 JST 2003

register 変数が既に使われていても、わざわざsaveする必要はない。
戻って来ないから。register を使ったことにするには、used_max_register_var
を設定してやれば良い。

Intel版で goto が動かなくなったのは、arg_offset が、register 変数分
も取るようになったから。save することを考えると、その方が良い。実際、
function call があるとsaveされてしまう。ということは、別に r20-r29
である必要はないってことか。通常のinput register varで良い。とすると、
register変数をsaveする必要もないね。
ただ、input register var は、function callの前には saveする必要が
ある。でも、これは、やっぱり手遅れか。ってことは、やっぱり、
r20-r29が良いってことか。

jump() では、呼出し引数は、-arg_size つまり、局所変数と
同じ扱いになっている。ってことは、

                 * gotoを呼び出した関数のr1 ! r1(goto前のr1)
   #             *                           r30<----r1_offset---------> r1
r+ +----------+--+----------+----------------+-----------+----------+----+
    cousin arg xx  reg save !callee arg      !code local  caller arg  xx
                   r20-r29     lvar >0        lvar<0      lvar>0x1000 000
                   f20-f31  <-my_func_args--><--disp-----><-max_func_arg->
                              *size_of_int                  *size_of_int

                  r1 <----------------------r30 (return continuation)

で、callee arg は保存されたまま、code local だけ変わるってことだね。

return continuation で、構造体を返そうと思うと難しい。そもそも、
浮動小数点が、ちゃんと返るのか?

Thu Apr  3 13:47:23 JST 2003

r1 は stack top に保存してあるものを、そのままenvironment
として渡すのが良い。

stack 上のデータが64kbyteなのは制限だが、やむをえまい。

というわけで、powerpc 版の CwC はできあがり。

    return continuation での構造体の引渡し
    function のprototypeでの重複した引数の省略

あたりが、まだ、テストしていない。あと、

    関数単位での構文木の作成
    従来のフレーム構造の再利用バージョン

も課題ではある。


Fri Apr  4 10:41:22 JST 2003

おいぉい、-O3 にすると、mc-codegen.c の arg_register は
r14 まで使うよ。それは、まずいんでないかい? 困ったなぁ。

Mon Apr  7 14:29:51 JST 2003

そういえば、unsigned char は処理してんの? crgvar はあるけど、
curgvar とかはないみたいだけど。

あと、-1.0 とかが d2i とかを生成するのを直してないんでないかい?

MIPS の比較命令は、

        beq     $2,$3,$L18

        slt     $2,$2,$3
        bne     $2,$0,$L17

という感じなわけね。(signed less than か?)

だとすると今の方法ではうまくないかも。

PS2Linuxのアセンブラが低能すぎて、forward reference を全然
解決してくれない。どうすりゃいいんだ?

.include を使うと良いらしい。(そんなんでいいのか?!)

csvalue() で取って来たregisterを誰がfreeするの?

Tue Apr  8 14:52:06 JST 2003

MIPSには bgez とか bgtz とかいう命令があるのね。なんかに
使えるの? 使えるけどさ。今のコンパイラで使う方法は?

gccが浮動小数点レジスタを避けるようにコンパイルしている
のは何故だろう? 遅いから? jal dcmp とかは、やっぱり変。

double と float の差が良くわからない。

Wed Apr  9 16:20:00 JST 2003

LOR LAND の定数の扱いを追加

配列の処理があるから、変数*定数ぐらいのh最適化は
入れた方が良いかも。その方がレジスタも少なく使うし。
(また?)

授業で使うように、また、最適化を落したものが必要かな。

MIPSの浮動小数点ってさ、single precision しか機械語命令が
ない? dpsub とかを呼び出すのっておかしくない? (まぁ、
いいんだけどさ)

Fri Apr 11 14:36:33 JST 2003

(二日酔だ...)

要するに、
     浮動小数点レジスタは single float しか使えない
     double は、すべて、汎用レジスタに置き、計算はすべて、 subroutine
ってことだよね。(あ～、やだやだ)

single float だけでの演算を導入するためには、DSUBの他にFSUB
などを導入する必要がある。これは「うざい」。不可能じゃないけ
ど、かなりめんどくさいね。浮動小数点誤差の問題もあるし。全部
double に変換してから計算すれば問題ないかと言うと、そんなこ
とはないわけだが。せめて、浮動小数点レジスタ上での演算をおこ
なうsubroutineはないの? (あるかも知れない)

まぁなぁ。FCOMPとかやればいいだけなんだけど。

Sat Apr 12 13:30:07 JST 2003

jal dpadd は、やっぱり、かなり複雑な浮動小数点演算だというが
わかった。IEEEの形式と合わないとかとかでそうなったんじゃなか
ろうか? もっとも、PlayStation に合わせてあるのかも知れないけ
ど。

ということで、single float 計算を入れないと、もとのgcc との
差が大きすぎるだろうと思う。ってことは、fmachineop とか FSUB
を入れないとだめってことか。まぁ、やれば、いいだけなんだけど、
他のCPUとの調節がなぁ...

今は、float の演算もpipeline上では1clockなんだろうから、
できればdouble でやって欲しいけどね。とはいえ、double/float
の変換が不要になるので、float base だとMIPSの方が速い
ってことにはなるかも知れない。

gdb のdisass を見ると、jal bpadd とかは特定レジスタ
を使った間接代入になっているらしい。また、disass の
レジスタ表示が、

    $a0 $a2 $a3 $at $f0 $gp $ra $s0 $s1 $sp $t9 $zero $v1 $f12 $at

とかなので、よくわからん。こまったものだ。これも、
ちょっと時間かかるのかな?


まぁ、なぁ... ANSI-C に従おうと思うと、このあたりのfloat/double
はうっとうしいよね。でも、とりあえず動けば良い?

expr の引数として「output type」を入れるか? 基本的には assign
で決まるtypeを要求する。やっぱり、C の規格書がいるんだろうなぁ。
(それは嫌だな...) CbC として、そういうものを入れるのが本当に
正しいの? (さぁねぇ...)
    float  = float op float
は良いんだけど、
    double = float op float
の時に、必要な精度を確保できない。cast すれば良いんだけど、それは
ANSI-C とは異なる挙動になってしまう。ま、いいか。

MIPSはdouble=float ということにするっていう手もあるね。
その方がきれいか。でも、どうせ、他のCPUもあることを考えると、
fbinop するんじゃないの? lbinop も出さないとだめだろうし。
short とかunsigned char の扱いもね。(sigh...)

まぁ、時間の問題だから、やれば良いだけなんだけど。めんどい!

(せめてdoubleのルーチンが浮動小数点レジスタを使ってくれれば
楽だったのに～)

Mon Apr 14 23:29:37 JST 2003

やっぱり、ちょっと変更大きいなぁ。

Fri May  2 14:53:16 JST 2003

なんでもいいけど、power-pc の test/basic が通らなくなってる。
(ま、そうだよな....) struct-pushと args-works の途中で
動かなくなったらしい。

あと、引数の引渡しだけど、printf (...) だけ特別扱いしたら?
プロトタイプがあるのを特別扱いする必要はないんじゃない?

Sat May  3 18:38:57 JST 2003

わかりました。contains_in_list を修正するのを忘れているね。
あと、get_register は、どうせ足りなくなるわけだろ? その
時はどうするの? 足りなくなるのは関数呼び出しの時だけ?
(かな?)

だとすれば、関数呼び出しのsaveの変数を局所変数も使えるように
すれば良いだけだね。

Sun May  4 09:18:32 JST 2003

関数呼び出し時の浮動小数点を格納する、r8,r9 の扱いが
おかしい。

emit_push / tosop で局所変数だけは特別扱い
した方がいいんじゃない? register full だと、

     register にload (emit_push)
     register full でそれを局所変数に代入 (*)
     演算時にregisterに再代入

まぁねぇ。それだと、mc-code-386.c の時代に戻るわけ
だけど。まぁ、その方がいいのかな。もっとも、(*)
が起こらなければ、特に問題はないんだけどね。

局所変数、大域変数、定数の足し算とかは処理した方がいいのかなぁ。

Sun May  4 15:10:48 JST 2003

たぶん、oprt とかは、それほど効果は無いよ。効くのは、
register full の時だけだろ?

MIPS version は、まだまだ全然と言う感じ。ゆっくり
片付けて行くしかないね。

Sun May  4 18:29:26 JST 2003

d50 では、引数はレジスタに $4,$5,$6,$7 の double 二つしかのらない。

f50 では、引数は
        $f12,$f14,$6,$7
というように4つ乗るらしい。(こまったもんだ...)

i50では、$4,$5,$6,$7 だね。

あとはstackに積むみたいね。

これらを get_input_register_var で処理するわけか。

Mon May  5 15:28:07 JST 2003

code_fconst/code_dconst と code_drgvar(e4,d,reg) みたいなのが
入混じってるな。ま、いいんだけど。

やっぱり、後者に統一。(めんどさ～) free で d を指定するのはまずい。

Thu May  8 11:02:42 JST 2003

regs/fregs の複数は必要ないんじゃないか? 一つで良い? 外から
は見えないから、mc-code-mips だけでそうするのが良い。

register のやり方を工夫しないとだめか。

あーめんどい.... 本当に動くのか?

double のライブラリ呼び出しで$3,$4,$5,$6 を使うわけだけど、
ここは必ずあけておかなければいけないわけだよね。でも、実際に
は、ライブラリの呼び出し後には$3,$4 が使われてしまう。ここで、
emit_push されると気まずいが...

本当のfunction callと同じ扱いでもいいんだけど、それだと
ちょっときつくない?

なんか浮動小数点レジスタ変数へのdpreinc/dpostinc を定義して
ないんじゃない? それは、まずいんじゃないの? dassop もそうか?
あれ? なんか何もしてないみたいだな。Intel 版にはレジスタ変数
がないから、テストしなかったのか。code の引数はレジスタに割
り当てられるから、そのあたりでテストすることは可能だろうね。
まぁ、これ自体は難しくはないが...

code segment では浮動小数点レジスタに割り振られてしまうので、
実はエラーが出ていたんじゃないかな。これはテストプログラム
を書くべきでしょうね。

あるいは#define REG register でテストする必要があるわけね。

MIPSでは、$4,$5,$6,$7 は、本当に特別扱いしないとだめだね。

Thu May 15 21:25:45 JST 2003

fregv は、やっぱりサブルーチン・コールにするんだろ?
(さすがに授業が始まってしまうと、なかなか進まない...)

Sat May 17 13:57:12 JST 2003

$4,$5 を常に creg または、double のfregとして使う。
$f12 はfloating 用。

もちろん、emit_pushすればずれちゃうけどね。rename するべきか?
そもそもrenameは必要ないんじゃないの?

あともう少しなんだけどねぇ。やる気がでん...

Tue May 20 11:08:44 JST 2003

freg と同じように dreg を作る? (そうすると ia32
の書き直しがあるが、それは良いとして...)

でも、mc-codegen.c が creg/freg に依存しているから、
それを書き直すのが結構めんどくさい。書き直して
大丈夫なのか? ううーん...

逆にcreg/dreg/freg を無くすってのは? 全部、creg で
やるわけだな。ちょっと書き直しが多いけど。原理的には
それでいいはずだけど。着目しているcurrent register
は一つのはずだから。
(1)
   creg int
   freg double/float

ってなっているからおかしいのであって、
(2)
   creg int/double/float
か、
(3)
   creg int
   freg double
   greg float
だよねぇ。

やっぱり(2)かなぁ。long long のことをとかを考えると。
でも、とりあえず(1)でやるか。

いずれにせよ、fregv を追放することからはじめるんじゃない?

それはできました。

Thu May 22 23:40:13 JST 2003

3808                macro = (char *)car(nptrm->dsp);
3809                if (nptrm->sc==MACRO) {
3810                    while((*macropp++ = *macro++));
3811                    macropp[-1]=c;
(gdb)
3812                } else if (nptrm->sc==FMACRO) {
3813                    if(c!='(') error(MCERR);
3814                    *macropp++=0;
3815                    macrop = macro_function(macrop,&body,nptrm,
3816                            list2((int)macro,history));

MACRO の場合のrecursive な処理を忘れいているみたいだけど。
それでも良かったはずなんだけど、macro_buf がstatic なので
不都合が出ているみたいね。

recursive に処理すると、
   #deifne car(e) heap[e]
   car(e)
みたいな時にまずい。これは、どうするんだっけ?

LMACRO ってのがあったみたいね。

Sun May 25 21:48:46 JST 2003

macro_eval がまだおかしいのは置いといて...

単純にcreg/fregを統一してしまうと、
     fdecl で creg をセット
した時に、float/double/int にどれかに固定される。そのまま、
coce_rlvar(creg) とかを呼ばれてしまうので、ちょっと困る。
code_rlvar で、if(!is_int_reg(creg)) creg = ireg;
とかすればいいんだけど、それは、ちょっと変だよね?

そもそも、mc-codgen.c でcregを持ち歩いている理由は?
なんかあったような気がするが...

そうか、
   use_int_reg()
とかしてやれば良いわけね。(rname を使うかどうかはともかく)

code_rlvar とかで設定するregisterを勝手に変えられると
うれしくない。(よね?) codegen 側で use_int_reg()とか
できればいいんじゃないの?

Mon May 26 21:06:14 JST 2003

code_* 側でやるか、mc-codegen 側で行うか? どっちかなぁ。
code_* 側の方が良いような気もするけど。

Thu May 29 10:30:09 JST 2003

freg/creg の区別は mc-codegen 側でやっていたんだから、
mc-codegen 側でやらないと、mc-cdoe-* 側での動的
チェックが増えすぎてしまう。

creg/freg を共有するのは良いのだが、その設定は
mc-codegen 側ですべきなんじゃないの?

mc-code-* 側を修正するとバグが取り切れない...
(といいつつ、もう、すぐなんだろうけど... でも、なぁ)

cast を自分で定義できる言語なら簡単なんだろうけど。

Tue Jun  3 13:03:41 JST 2003

あぁ、なんか乗り切れない。CONV の直前でcregが不定だ。
どっかで use_float を忘れているんだろうな。

Wed Jun 11 12:27:58 JST 2003

なんか、ようやっと creg/ireg/freg が片付いたよ。
creg を変更したときに、ireg を変更し忘れることが多かった
みたい。set_creg を必ず使うようにすれば良いだけだと思う
のだが。

Thu Jun 12 19:34:48 JST 2003

まぁ、MIPS用のレジスタ割り当てを書かないとだめだね。
ちゃんと書いてもいいんだけどさ。なんか one path に
するのが面白いんでしょ?

Sun Jul 13 18:26:29 JST 2003

また、一カ月なにも書かなかったのか。 mips は、mc-code-power.c
から書き直した方が良さそうだね。

   regs/regv は、i/f/d のすべてのレジスタに関して一つ

でないと stack に積むのを統一できないから。そういう意味では、
reg_stack と freg_stack を区別する意味はないわけね。でもstack
は型付けした方が良いから。でも、区別しておくと、long を増や
した時にも、stack を増やさないとだめなんじゃない? なので区別
しない方が良い。でも、それに手をつけると、また時間かかるんじ
ゃないの? そのためにはスタックそのものに型付けしないとだめだ
から結局同じか。

mips の double を格納するためのregister pairは、regs に
格納する。regs にアクセスには必ずアクセス関数を通す。
なるほど。

get_input_dregister_var なんだけど、dregister pair の
場合は、常にpairが決まった値になる必要があるよね。
この分はどうする? 前もってとっておくか?

あ、そうか、任意のregister pairを許さなくても良いよ。input register
に対応する連続したregister pair だけを許そう。そうすれば、あ
まり気にしなくても良くなるから。でも、gcc が奇数pairを許して
いたら気まずくない?

regv は、register rename がなければいらないんじゃない?

Mon Jul 14 10:54:46 JST 2003

なんかなぁ... creg/ireg/freg/dreg は、あんまり良いアイデア
では、なかったみたい。creg は、このうちのどれかでなくては
ならないんだが、それを保証できない。

前と同じで、creg を廃止して、ireg/freg/dreg/lreg とするか?

Mon Jul 14 14:25:23 JST 2003

なんか unsigned が通らなくなっているみたい。

Sun Jul 20 17:37:34 JST 2003

やっぱり dictionary は、書き直さないとだめだよな。
それに関して、heap も修正した方が良い。このコード
はあんまりだものなぁ。

さて、あとは、オフセットだけど... めんど...

Mon Jul 21 15:12:56 JST 2003

Frame pointer は使うの? 使った方がいいんじゃない?
PowerPC は使わなかったけど。

Tue Jul 22 08:12:48 JST 2003

switch 文をtableにコンパイルするには...

最初の比較の行き先を後で指定するようにする
        cmp reg,case_value
        bne L_NEXT
   ....
   L_NEXT:
を、
        cmp reg,case_value
        bne L_CASE
   ....
   L_NEXT:
      ....
   L_CASE
で、case 文が終ったらtableを作る。table がいらないようだったら、
   L_CASE = L_NEXT

各caseの入口は覚えておく。
      (list of (value, label))

table は、どうやって作るかと言うと、

   まず、値の分布をチェックする
   密度の高い表を作る(端のいくつかを除いて連続していること)
   というか、(定差分で)連続している部分にだけ表を作れば良いか。
   table は8entry以上。それ以下は、2分法に負ける。
       (list of (number of entry, diff, (list of (value,label))))

512 or 128kbyte まで容認する。限度はなくても良いか。連続している
部分にしか表は作らない。

連続してない部分は、2分法にする。

2 分法でもいいけど。2分法にする? その方が簡単かな。最後のス
テージは、(順序が一致していれば...) 元のコードが使えるし。そ
うすると、sort して、真中かから比較して行けば良い。そうすれ
ば表の分布とか考えなくても良いからいいかもね。

簡単じゃん。

まぁ、やっぱり、構文木の先読みをするんじゃないの? そうすれば
reference のとられてない変数もわかるし。

Wed Jul 23 16:21:12 JST 2003

やっぱり構造体のタグの名前はname tableにいれちゃだめだね。
まぁ、いれなきゃいけないんだけどさ。どうする?
どうするっていっても...

Thu Jul 31 15:07:08 JST 2003

C から変換したコードは動いたけど。まぁ、cast は動くのは
良いんだけど、こういうのじゃなくて、link を使った変換
でもいいんじゃない? そうすれば、spaghetti stack でもOk
だな。ただ、GC がないと使い物にならないだろうが。

Link にすれば、型整合のある変換も可能だよね。ただ、union
は意味ないか。record 型に直さないとね、

recursion と loop をdetect すれば、static にcompile
できる。あるいは、recursion の部分だけ配列にできる
んじゃないかな。

それぞれの利点と欠点を考察すればCWは通るんじゃない?
(本気?)

Mon Aug  4 12:48:40 JST 2003

converted call
480
8.070u 0.010s 0:08.22 98.2%     0+0k 0+2io 0pf+0w
call
480
6.590u 0.000s 0:06.67 98.8%     0+0k 0+0io 0pf+0w

だいたい10%ぐらい遅いなぁ。(なんで?) げ、-O6 だと十倍違う...

げ、powerpc の subroutine 内のstaticが通らんじゃん。

サブルーチンを三段に直しました。

% time ./a.out 0
720
9.590u 0.010s 0:09.64 99.5%     0+0k 0+0io 0pf+0w
% time ./a.out 1
719
12.610u 0.020s 0:12.71 99.3%    0+0k 0+0io 0pf+0w
% time ./a.out 2
720
6.310u 0.020s 0:06.41 98.7%     0+0k 0+0io 0pf+0w
% vi test/conv1.c
% gcc -O6 test/conv1.c
% ./a.out 0
720
% time ./a.out 0
720
1.990u 0.020s 0:02.03 99.0%     0+0k 0+2io 0pf+0w
% gcc  test/conv1.c
% time ./a.out 0
720
7.530u 0.000s 0:07.64 98.5%     0+0k 0+0io 0pf+0w
% gcc -O2 test/conv1.c
% time ./a.out 0
720
3.520u 0.010s 0:03.55 99.4%     0+0k 0+0io 0pf+0w
%

ま、こんなものかな。-O2 に負けるなよって気もするが。

琉大は40Mbps

Intel PC (on PowerPC) の場合

[root@localhost ~/device]# time ./a.out 2
470
0.660u 0.010s 0:02.37 28.2%     0+0k 0+0io 92pf+0w
[root@localhost ~/device]# time ./a.out 3
720
0.920u 0.020s 0:01.74 54.0%     0+0k 0+0io 92pf+0w
[root@localhost ~/device]# gcc test/conv1.c
[root@localhost ~/device]# ./a.out 0

[root@localhost ~/device]# time ./a.out 0
720
1.310u 0.030s 0:01.39 96.4%     0+0k 0+0io 92pf+0w
[root@localhost ~/device]# gcc -O test/conv1.c
[root@localhost ~/device]# time ./a.out 0
720
1.130u 0.030s 0:01.16 100.0%    0+0k 0+0io 92pf+0w
[root@localhost ~/device]# gcc -O4 test/conv1.c
[root@localhost ~/device]# time ./a.out 0
720
0.870u 0.000s 0:00.87 100.0%    0+0k 0+0io 92pf+0w
[root@localhost ~/device]# gcc -O6 test/conv1.c
[root@localhost ~/device]# time ./a.out 0
720
0.850u 0.020s 0:00.88 98.8%     0+0k 0+0io 92pf+0w
[root@localhost ~/device]#

PowerPC の場合は、PIC symbol がやっぱり遅いね。
こいつをなんとかするだけでだいぶ違うかも知れない。

Tue Aug  5 13:53:43 JST 2003

む、なんか、もう、そうなってるじゃん。

関数scope 内の staticの初期化が通らないんですけど。

直りました。対応してなかったみたいね。

Wed Aug  6 12:07:07 JST 2003

[kono@pw001 ~/device]% ./mc -s test/conv1.c
[kono@pw001 ~/device]% gcc test/conv1.s
[kono@pw001 ~/device]% time ./a.out 1
セグメントエラー (coreを出力しました)
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 73pf+0w
[kono@pw001 ~/device]% time ./a.out 2
470
0.350u 0.000s 0:00.35 100.0%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 0
720
0.650u 0.010s 0:00.65 101.5%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 1
セグメントエラー (coreを出力しました)
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 73pf+0w
[kono@pw001 ~/device]% time ./a.out 2
470
0.350u 0.000s 0:00.35 100.0%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 3
720
0.380u 0.000s 0:00.38 100.0%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 4
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 77pf+0w
[kono@pw001 ~/device]% time ./a.out 0
720
0.660u 0.000s 0:00.65 101.5%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 1
セグメントエラー (coreを出力しました)
0.010u 0.000s 0:00.00 0.0%      0+0k 0+0io 73pf+0w
[kono@pw001 ~/device]% time ./a.out 2
470
0.350u 0.010s 0:00.35 102.8%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 3
720
0.390u 0.000s 0:00.38 102.6%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 4
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 77pf+0w
[kono@pw001 ~/device]% gcc test/conv1.c
[kono@pw001 ~/device]% time ./a.out 1
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 77pf+0w
[kono@pw001 ~/device]% time ./a.out 0
720
0.430u 0.000s 0:00.42 102.3%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% gcc -O test/conv1.c
[kono@pw001 ~/device]% time ./a.out 0
720
0.370u 0.000s 0:00.36 102.7%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% gcc -O2 test/conv1.c
[kono@pw001 ~/device]% time ./a.out 0
720
0.370u 0.000s 0:00.37 100.0%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% gcc -O6 test/conv1.c
[kono@pw001 ~/device]% time ./a.out 0
720
0.240u 0.010s 0:00.25 100.0%    0+0k 0+0io 88pf+0w

Reading specs from /usr/lib/gcc-lib/i386-redhat-linux/2.95.3/specs
gcc version 2.95.3 20010315 (release)
Intel Architecture だと、結構、良い線いっているみたい。

Thu Aug 14 02:39:29 JST 2003

done
[kono@pw001 ~/device]% time ./a.out 0
720
0.640u 0.000s 0:00.63 101.5%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 1
719
0.720u 0.000s 0:00.71 101.4%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 2
470
0.330u 0.000s 0:00.33 100.0%    0+0k 0+0io 88pf+0w
[kono@pw001 ~/device]% time ./a.out 3
720
0.370u 0.010s 0:00.37 102.7%    0+0k 0+0io 88pf+0w


+jessica+kono time ./a.out 0
720
1.190u 0.010s 0:01.51 79.4%     0+0k 0+0io 0pf+0w
+jessica+kono time ./a.out 1
719
1.700u 0.000s 0:01.78 95.5%     0+0k 0+0io 0pf+0w
+jessica+kono time ./a.out 2
470
0.630u 0.000s 0:00.66 95.4%     0+0k 0+0io 0pf+0w
+jessica+kono time ./a.out 3
720
0.790u 0.000s 0:00.81 97.5%     0+0k 0+0io 0pf+0w
+jessica+kono time ./a.out 4
0.000u 0.000s 0:00.00 0.0%      0+0k 0+0io 0pf+0w

+jessica+kono gcc test/conv1.c
+jessica+kono time ./a.out 0
720
0.960u 0.000s 0:00.97 98.9%     0+0k 0+2io 0pf+0w
+jessica+kono gcc -O test/conv1.c
+jessica+kono time ./a.out 0
720
0.470u 0.000s 0:00.48 97.9%     0+0k 0+0io 0pf+0w
+jessica+kono gcc -O6 test/conv1.c
+jessica+kono time ./a.out 0
720
0.260u 0.000s 0:00.26 100.0%    0+0k 0+0io 0pf+0w

Mon Sep  1 13:49:43 JST 2003

short がやっぱり欲しいよね。long long はともかく...
そこまでいくと、ANSI-C 対応にできるんだが。long long
は難しい?

short は、そんなに難しくないはず。あとは、
    statement を含めたtreeの処理
    変換系の完成
この二つだな。GCC に組み込むのは無理だろう。

属性文法みたいな手法が使えればね。

あと、struct のtag。やっぱりword table を作り直さないと。

Wed Sep 10 21:53:16 JST 2003

short や unsigned short の前に、
なんか unsigned char もないんですけど。

Wed Oct  8 22:43:17 JST 2003

(また、一カ月、触ってないのか...)

無名 code はあった方がいいんじゃない?

   code *a(int i);
   a  = code(int j) { }

みたいな感じ? C にはないけどね。もともと、名前を消費する
方だからあった方がいいかも。でも、実行時に作られるわけじゃない。
それに、こういうものを作ると closure だと思われるような
気もする。closure みたいなものは「自分で管理する」ってのが
CbC の思想だろ?

そういえば、static なcodeはあった方がいいんじゃない?

    static code func() { .... }

か。それはそうだな。

Fri Oct 10 13:08:01 JST 2003

link register をうまく使うにはcontinuationに
指定するだけではダメで、
     goto hoge(....,next);
code next..
みたいなのがあった方がいいんじゃない?

goto の後のステートメントは無名codeになればいいんだよね。

stack を使わないサブルーチンみたいなものか。単なるcall
になるわけね。それもいいかも。

Sat Nov 22 15:51:36 JST 2003

構造体のfieldの定義のnptrは、大域の名前テーブルから
取り除かないといけない。でも、取り除いていしまうと、
構造体からのポインタがずれちゃうので、まずい。

filed専用の領域を作るのだと、複数の構造体が同じ
field名を持つときにちょっと困る。構造体のタイプに
埋め込むのがいいんだけど...

そうすると、構造体のfiledかどうかをgetsymがチェック
するときにちょっと困る。

filed をlinear searchするのは嫌だけど、しかたないか。

なんか、struct の中に、
    void (*case_)(int cases,int def);
とかがあると、
    void (*case_)();
    int cases;
    int def;
という感じで余計なfieldが定義されてるみたい。

adecl で nptr が引数の最後を指してしまうのがまずかった。

Mon Nov 24 00:52:31 JST 2003

signed char は実装しましたが... test routine がない。

あと、short は、code_crxxxx の中でbyteの大きさに従って
処理するのがいいかな。

Mon Nov 24 10:53:31 JST 2003

short も実装したけど、まだ、コンパイルは通らない。

そろそろ stdio.h を通さないとダメだね。(いろいろあるだろうなぁ...)
とりあえず、#include <> をなんとかしないと。

long long の演算はともかく long long の代入はできた方がいい
か。でも、それなら、構造体の定義でいいんじゃない?
   typedef struct { char a[4]; } long long
みたいな感じ? それはできないが、コンパイラ内部ではそうするという
手もある。

Mon Nov 24 18:59:30 JST 2003

うーん、こんなエラー残っているのか。code_cpostint とか
はぜんぜん使われないわけ?

struct { char a[4],a; } は直しました。

short の引数の扱いも修正。

Mon Nov 24 22:20:29 JST 2003

同じレジスタをずーっと使わずにstatementごとに
ずらすと、ちょっと速くなるかもね。どうなんだろう?
rename されちゃえばあんまり関係ないのかも知れないけど。

二つのレジスタを交互に使うとかだと、まぁ、誤差ですね。

Wed Nov 26 13:27:00 JST 2003

include path は内蔵のものと、外部のものと二ついるわけね。

predefined が結構無いといけないみたい。

にゃ～  inline は必須なの? macro で実装するのは難しいんじゃないかなぁ。
inline には、結構、いろんな変な部分があるんだよな。一旦はコンパイル
しないといけないはずだし。
    inline int f(int a,int b) {
	int c;
        c = a+b;
        return c;
    }
だよね。
    f(3,4)
があった時には、
    int _c,int _a,int _b; をlocal変数に付け加える
    _a = 3;
    _b = 4;
    _c = _a+_b;
をコンパイル。
    current register = _c
とする。かなぁ。

むしろ、
    c = { decl; statements* return value; }
を実装して、#define を拡張する
方が簡単じゃない? そのためには nest したdecl を扱わないと
だめだけど...

いや、やっぱり、中間木をなんとかするのかなぁ。

とりあえず、無視。普通の関数(static)としてcompileする。

やっぱり、long long はいるのね～

やっぱり、enum もいるよね～

なんか、知らないけど、やっぱり全部実装しないとだめなのね。

あと、const int かな。

Fri Nov 28 14:01:25 JST 2003

volatile ... (なにすればいいんだろう?)

なんか、*.c 以外だとソースを上書きしちゃうんじゃ...
  (これは直しました)

うーん、struct のtagとtype名を一緒にされちゃうのか...
こういうことをされると変数テーブルを直さないと動かせない...
TYPE_TAG みたいなアドホックなどだと直せない。
なんとかなんないかなぁ。

あと、struct のforward definition ってのがあるみたいね。

#if defined(A) && A で、後ろが評価されちゃうみたいだけど。そ
うすると後ろの名前がdefineされてしまう。ふーむ。こんなのどう
やって防げばいいんだ?

やっぱりlong long を64bit にしないとファイルサイズが
合わない。

やっぱり include は、そのファイルのある場所から読み込む
性質があるのか。

Sat Nov 29 19:01:26 JST 2003

typedef enum {
  ...
        REGS_SAVED_ALL                  /* All registers */
} regs_saved_t;

やっぱり、あるのね。


void    (*signal ()) (int);

が動かなくなってます。

Sun Nov 30 05:30:56 JST 2003

ようやっと <stdlib.h> が通った。

nkf.c が while() { int hoge;... } を使っているのは、変。
なんで、こういうことするかなぁ。これをサポートするのは
不可能ではないけど、いろいろ手直しがいる。

なんか、少し早めに n->sc が定義されちゃって、変な
ことが起きているみたいだね。

stat の関数名とtag名が重なっているみたい。やっぱり
tag名の名前空間をわけないとだめかぁ...

Sun Nov 30 17:41:04 JST 2003

マクロを登録するときには、コメントをとらないとだめ。

while のslfree でマクロのchptrsave が破壊されてしまう。

やっぱり、nkf.c は、一発では動かないみたいね。compile は
できたけどさ。

   >> は符号依存 テストルーチンが入ってなかった

うーん、K&Rの引数の順序が関数の引数とずれているときは、
関数の順序の方を優先しないといけない... う、うーん。

{
   extern hoge...
}

int
h_conv(f, c2, c1)
    FILE  *f; int    c1, c2;

まぁ、いろいろあるねぇ。

#define hex(c)   (('0'<=c&&c<='9')?(c-'0'):\
     ('A'<=c&&c<='F')?(c-'A'+10):('a'<=c&&c<='f')?(c-'a'+10):0)
fprintf(stderr,"mime_getc h: %d c2 %d c3 %d\n",((hex(c2)<<4) + hex(c3)),c2,c3);
        return ((hex(c2)<<4) + hex(c3));

ふむ。(?::)+(?::) みたいな時には、code-set-fixed-register のregister
が二ついるわけね。push できないの?

    case COND:        /* a?0:1 should consider non-branch instruction */
    case DCOND:
    case FCOND:
        d = (car(e1)==COND?INT:car(e1)==DCOND?DOUBLE:FLOAT);
        e2=fwdlabel();
        if(d==INT) emit_push(); else emit_dpush(d);
        b_expr(cadr(e1),0,e2,0);
        g_expr_u(assign_expr0(stack_top(d),caddr(e1),d,d));
        jmp(e3=fwdlabel());
        fwddef(e2);
        g_expr_u(assign_expr0(stack_top(d),cadddr(e1),d,d));
        fwddef(e3);
        if (d==INT) emit_pop_free(emit_pop(0));
        else emit_dpop_free(emit_dpop(d),d);
        return t;

は、あんまり良くない。register machine ならいいんだけど。
結構、実装が変わるから、code-$(ARCH) に移した方がいいかな。


なんか、arg_reording() が、
    PowerPC
	   fnptr->dsp = arg_reorder(reverse0(sarg),reverse0(fnptr->dsp));
    IA32
	   fnptr->dsp = arg_reorder(sarg,fnptr->dsp);
ということになっているみたい。おんなじ順序じゃないのね。どうしようかな。
これは、わかりました。

    case COND:        /* a?0:1 should consider non-branch instruction */
    case DCOND:
    case FCOND:
        d = (car(e1)==COND?INT:car(e1)==DCOND?DOUBLE:FLOAT);
        e2=fwdlabel();
        b_expr(cadr(e1),0,e2,0);
        g_expr0(caddr(e1));
        t = creg;
        jmp(e3=fwdlabel());
        fwddef(e2);
        g_expr0(cadddr(e1));
        code_set_fixed_creg(t,1,d);
        fwddef(e3);
        return d;

なんだけど、t のcregが、ia32 ではvirtual register なので、変更される
ことがある。(こまったもんだね)

CONDには type をいれた方がいいみたいね。a?b:c type でlist5か。


 void    (*signal ()) (int);

これだと signal が二回 function だと思われる。

   recursive macro
#define stdout stdout

main()
{
   register double d;
   int i = stdout;
   d *= i;           register float への assop
   return (int)d;
}

というわけで、nkf は system の/usr/include/stdio.h で動きました。
なんか、うれしい。

ptr_cache のmr は確かに無駄だけど... 保留してまで取り除く
価値はないんじゃないかな。でも32bitとってるかならなぁ。
lvar cache みたいなものも面白いけど。まぁ、そこまで
やるなら、レジスタの寿命とか見ればいいんだよな。。。

Wed Dec  3 13:11:15 JST 2003

スレッドとの相性
っていうか、こいつをthread libraryとして使うにはどうすればいいの?
    env と return を生成する?

構文的に別にした方が安全だけど。

Sun Dec 14 16:26:19 JST 2003

long long やるの? 割算はサブルーチン呼び出しみたいね

float/double から long long, unsigned long long への変換もいるのか。
    F2LL
    D2LL
    F2ULL
    D2ULL
    LL2F
    LL2D
    ULL2F
    ULL2D
かぁ。(めんどくさいだけどさ)

(本気? どれくらいかかる? 2-3日かなぁ...)
     (実際には半年かかった...)

getsym の数字の扱いはunsignedでするべきだよね。
で、- があった時にoverflow を検出するのが良いよな。

あと、strol とかのoverflowの検出をさぼってるな。

Fri Jan  2 09:53:53 JST 2004

     goto hoge(...,next);
     fuagua....;

みたいな構文をいれる? Fortran みたい....
(簡単か?)

Sat Jan  3 17:12:46 JST 2004

FEATURE_LONGLONG
FEATURE_FLOAT

みたいな感じで feature を落せる方が良い? 機能を増やす方向
とは相性が良くない言語だから。

LEとかLTは、GE,GTで置き換えられるんだけど、片方が定数のときには
dual_op で入れ換えられちゃうので、やっぱり必要なみたい。

Mon Jan  5 15:55:37 JST 2004

byte code format というよりは、やっぱりbyte code encode
された構文木が欲しいんだよね。

ついでに interpreter も作るか。byte code interpreter ではなくて、
(ではなくて?) code 生成が速いんだから、code生成しながら実行する
方が良いね。やっぱり、incore compiler か。

inline なんだけど... #define に置き換えられる?
    inline int hoge(int hoga1) { hoge2 }
は、
    #define hoge(hoga1_0) {
    #define hoga1 ((int) hoga1_0)
    int hoga1 = hoga1_0; hoge2 }
でいいわけだよね。で、問題は return だけど...

うーん、いま6ですな。

inline は、そのままstringバッファにしこんで、関数呼び出し時に
処理する方が正しいか。

    引数は、#define hoga1 ((int) hoga1_0) していく。
    展開終了時に元に戻す

あぁ、でも、大域変数がまずいか。

ということは、やっぱり、その場で構文解析してしまうのが良い。
    inlined LVAR (ARG)
の両方が必要。tree のコピーなしに展開することは可能? (できそうだけど...)

ということは、やっぱり、制御構造にもnodeを割り振るべきだよね。

order 1 compiler  + JIT + intensive optimizer

ですかね。

Wed Jan 14 10:21:49 CET 2004

function callを compiler の外に出せないかなぁ。
     code function_interface(args) {
          .....
          push(args); (in asm)
          push(next);
          goto function...
     }
     code function_continuation(args) {
     }
みたいな感じで... ま、遅くなるだろうけど...

でも、そうすれば、コンパイラの移植は比較的簡単になる。

Thu Jan 15 11:52:03 CET 2004

stack は、
    system wide に一つ ( classical environment)
    code に一つ ( Fortran type )
    object に一つ (like message buffer in ABCL)
っていう選択もあるね。

Sun Jan 18 11:08:13 JST 2004

(なんか、遅すぎなんだよね... CPS 変換か...)

shift/reset をCで実装するのは簡単だが...
     reset{
                 shift();
     }
みたいな感じ?

stack / data structure の保護の方法に、もっと何かがあるんじゃ
ないかな。

関数呼び出しなんだけど...

apply みたいなのがあればいい?
    goto apply(function_name,continuation(return_type),args....);
かな。で、この部分を、C/asm で書くというわけね。
ま、おんなじようなものか。(何と?) この部分だけ interpreter 的に
なっちゃうな。varargs でもいいんだけど...

コンパイラをCbCで書くと言う作業が残っているんだよな...

う、やっぱり、long long は、遠い... できんの?


Mon Apr  5 00:20:13 JST 2004

間違えて3日分消しちゃったい。

int でも RLVAR とかの unsigned/signed の区別がないとまずいよね。

包括的なテストルーチンがあった方が便利。long.c を消しちゃったし。

Fri Apr  9 02:11:42 JST 2004

やっぱり incore compiler と、non textural syntax が欲しい。
ま、そうだよね。

あと、#include の search path のセマンティクスを直さないと。

Mon Apr 12 12:19:35 JST 2004

3461        if (!integral(t=cadr(type))&&
3462                    !(t==FLOAT||t==DOUBLE) &&
3463                    !(t==LONGLONG||t==ULONGLONG) &&
3464                    (car(t)==STRUCT||car(t)==UNION)) {

じゃなくて、t>0 && (car(t)==STRUCT||car(t)==UNION)) {
じゃないか?


Wed Apr 14 14:26:04 JST 2004

creg なんだけど、直接レジスタを入れるのだと「複数レジスタを
使って double / long を扱う」ってのがやりずらい。だから、
register 変数を入れるのがいいんじゃない? でも、そうすると
変更が多くなるけど...

free_register の関係があるから、やっぱり、全部変えないと
だめだね。

creg/freg を止めたのは、MIPSが float/double を区別する
必要があるため。この時に、creg を構造体化するべきだった
みたいだね。
      creg = { ireg, freg, dreg }
みたいにしても良かったわけだ。

もしかして、regv って使ってないの? (そうかも...)

register は list で持つ? 配列にいれる?
      regs[0] = glist4(LREGISTER,use,r1,r2)
      regs[0] = glist3(REGISTER,use,r1)
みたいな感じ? うーん... それよりは、
      ireg_list
      dreg_list
      freg_list
      lreg_list
かな。でしょ? 意外にめんどくさい。ptr cache のコードもあるし。

まぁ、conservative にいこう。

lreg は、積極的に解放しないとまずいけど、どのタイミングで?
というか、creg もそのタイミングで解放して良いんじゃない?
ふーん。

gexpr_init() のタイミングで解放してもいいんだけど、それだと、
gexpr_0 で廻っているときに解放されないけど。
     g[long long hoge]
みたいな場合では、途中で解放して欲しいよね?

use_int とかで lreg は解放して良いんじゃない?

creg =0 で free_register(creg) が呼ばれているね。困ったな。

Sat Apr 17 17:01:02 JST 2004

long long register で、regsと regv をそろえる
必要はない。regs は普通に用意して、regv ではなくて、
lreg_hとlreg_lみたいな感じにする。

うーん、register full かぁ。何おかしくしちゃったかなぁ。

Wed Apr 21 17:32:40 JST 2004

unsigned のcosnt計算がおかしいんじゃない?

Thu Apr 22 12:33:04 JST 2004

ようやっと、int/float が元に戻りました。

lrexpr は、codegen で、long の計算に置き換えた方がいい?
でも、それだと、64bit 演算をサポートしているCPUがうれしく
ないか。

あと、もう少し! でも、2,3日かかりそう。
loprtc も、あった方がいいんじゃない?  (まね....)

Fri Apr 23 14:40:02 JST 2004

あとは、switch, inline, stdargs, alloca かな。 asm もあるか。
asm は、ちょっと趣旨から外れるからいいか。

PowerPC のalloca は、おかしい。おかしいよな。

join いれるの?

a?a,b:a,b って許されるの?

"" の中のマクロが展開されてしまうんですけど。(ま、そうなんだけど)

#hoge は無視するか、そのままにするか...

Sat Apr 24 14:39:14 JST 2004

long long op int, unsigned long long op int/unsigned

ってのがあるのか.... うーん...

Sun Apr 25 17:20:40 JST 2004

実装しないのにテストルーチン入れるなよ。。。 register lassop

compiler を書くには...
   (1) parser を書く
   (2) code 生成部を書く
   (3) compiler のcompile エラーを取る
   (4) compiler のコード生成をデバッグする
   (5) 生成したコードがアセンブラを通るかどうかを直す
   (6) 生成したコードが正しいかどうかを調べる
で、(4) までできました。


やっぱり、use_int とかって、なんとなくだめ。だめな
理由があるんだろうなぁ。ほとんどバグはここから
来るんだものね。

use_int とかは、codegen でやったんじゃいけなくて、
もっとも下のcode生成部分でやらないといけないんじゃない?
それでいいのか?

あ、そうか、

creg に対する操作ばっかりじゃないので、code_xxxx(xxxx,creg)
というようになっている。そうすると、creg をその外で
creg = use_int(creg) する必要がある。だね。

    void
    code_lvar(int e2,int reg) {
	creg = use_int(creg);
	lvar_intro(e2);
	printf("\tla %s,",register_name(reg));
	lvar(e2);
    }

だと、reg が間に合わない。手遅れ。

reg にcreg 以外が入るのは、基本的には assign_opt 系ですね。
これを creg に直せば。。。。

    void
    code_lvar(int e2,int reg) {
	if (reg==-1) {
	    creg = use_int(creg);
	    reg = creg;
	}
	lvar_intro(e2);
	printf("\tla %s,",register_name(reg));
	lvar(e2);
    }

みたいな?

    #define use_int(reg) if (reg==-1) reg = use_int0(reg)
    void
    code_lvar(int e2,int reg) {
	use_int(reg);
	lvar_intro(e2);
	printf("\tla %s,",register_name(reg));
	lvar(e2);
    }
    use_int0(int reg) {
	creg = ireg;
	return creg;
    }

かな。 #define で? ま、どっちでもおんなじようなものか。

でも、これは変更多いなぁ。

Mon Apr 26 05:35:24 JST 2004

一応、no long long は通ったみたいだが。。

構造体の戻値を持つ場合に、引数がないとうまくいかない。

#include "" は、今読んでいるファイルのcurrent directory も探す。

まぁ、ia32 は、eax,edx にlong,long を積んで、あとは、
対メモリで計算するわけね。そうだろうな。むしろ、
やさしいかも。

あぁ、そうか、long の引数の渡し方は、
r10 はレジスタ、残りはメモリに入るわけね。

Wed Apr 28 13:01:13 JST 2004

だいぶ、通りました。ltosop は、終り。

drexpr, lrexpr で cond を処理してなかった。

浮動小数点の誤差はどうしようもないの? printf の問題?

あぁ、なんか、まだ、printf が局所変数を壊しているね。

そういえば、局所変数のアライメントは合わせてないけどいいの?

unsigned って、もしかして、もう少しルールが複雑?
              /   %   <<   >
    I op I    I   I   I    I
    I op U    I   I   I    I
    U op I    I   I   U    I
    U op U    U   U   U    U
でもないか。

なんか、いろいろ直した割に、進んでないな。

code_bool がjmpを使うのはいかにもまずいよね。そうねぇ。

しかし、float/double printf("%d",f0>f1) の真偽値だけが反転する
バグが取れない。

code-gen.c の方は動いたが、float.c の方がだめ。
なんか、まるででたらめに動いているみたい....

function() の中で、lreg がinput registerと重なってしまう。

Thu Apr 29 19:40:08 JST 2004

良くわかんないけど通った。

Sun May  2 09:40:21 JST 2004

やっぱり LREGISTER なんて作るんじゃなかった。code_lconst
とかで edx,eda と dsi,edi pair の切替えをやらないと。

Thu May  6 08:33:23 JST 2004

ia32, powerpc とも long long まで、通りました。ia32 も一週間
かかったか。次は、MIPS, ARM ですな。

大域変数+オフセット ( heap[3] みたいなの) で、
heap+24  とか出ない。もともとは offset,y だったから
いらなかったんだけどね。

互換性を捨ててしまえば、大域変数ポインタを導入しても
いいんだけど。だだ、32bit 以上のオフセットだとRISC
命令だとまずい。

オブジェクト指向だとそのあたりは解決するんだけどね。

longlong/float のregressionはいいんだけど、もう少し
整合性があった方がいいかもね。

なんか、Linux のinclude directory って、どうにかなんないの?

assop で、
    calc left exp
    move creg,dreg
    move const,creg
    op  creg,(dreg)
って、やっているのなんか変じゃない?

a && b で、b のboolを計算しているのは変。use のフラグ
を見るのを追加したら。


Sat May  8 21:29:32 JST 2004

浮動小数点やlong longの代入で同じ値は一つにまとめるべきだよね。
連想 list を一つ持てば良いだけだし。

string をまとめるかどうかは、const かどうかによるわけだが...

RETURN register あたりの処理がダサイ。ま、しょうがないか。

MIPS のdebugにかかるんだけど、今は時期が悪いよな。なんで、
もっと早くできなかったのか。gcc modification はどうした?

だから register を 0 で入ってないとするのはまずいって
言っているのに...

float は normal register に積むのか。

        s.s     $f4,16($sp)
        mov.s   $f12,$f0
        mov.s   $f14,$f1
        mfc1    $6,$f2
        mfc1    $7,$f3
        jal     f

ま、いいんだけどさ。(でも、なんで$4,$5 を使わないんだ?)

long long も4,5,6,7 しかレジスタに積まない。ま、正解だけど。

げ、レジスタのセーブって自分でやるのか。(じゃ、mask ってなん
だよ...) ってことはentry はあとで出力しないとだめだね。

まぁ、いちいち驚かないけど... 細かいエラーが残っているな。

やっぱり codegen の拡張法を作っておかないとダメだね。

関数呼び出しパートをCbC自身で書けないのかなぁ。
あまりにめんどくさすぎ。

cpload は、gp レジスタの処理に関係するらしい。gp レジスタって何?
cploat $25 の $25 は、stack offset みたいね。$sp を変更するときに、
なんかのフラグを壊さないようにするための処理みたい。

だとすれば、code segment 側でstackを頻繁に移動するのはまずい?

float/double のフローは mc-parse では、少し、齟齬があるみたい。

は、良いとして....

    cprestore, mask の計算
    offset の合わせ

が終れば動くの? それだけ?

あぁ、
    int endian;
    extern int endian;
も通す必要があるのね。まぁ、フラグの扱いだけだけど....

Thu May 13 12:58:58 JST 2004

 .frame の数字には input variable のsave分も入るんじゃないの?

   code_l1 の  ll0 がおかしくなるのは、strtoll がintに宣言されてるから。

function のargumentは複雑なものから計算して行くのがルールなのね。
ま、そうだよな。できないことはない....

そうなのか。最初にループを廻して複雑なものをレジスタなり変数なり
に代入して、引数リストを置き換えてしまえば良い。ついでに、
代入するべき変数はそこで計算しておいて... (って、これって、
parallel_assignment でやっていることと同じか)

その部分はcodegen でやってもいいんだけど... ia32 のような場合は
むしろ不要なのか。

でも、やっぱり、意外に複雑だよ。struct をどうするかとかさ。

struct は、call memmove するんだけど、そいつを先にやるわけには
いかない。先にやると、その間のfunction callが壊してしまう。
後に持って良くと、input register が壊れるので、やっぱり、
特別扱いする必要がある。ってことは...
    complex function argument
    struct copy
    simple arguments
っていう順番でやれば良いってことか.... うーん。

(うーん、でもなぁ。やるの?)

function argument の計算で、long long register が破壊されるのは、
なんか方法が悪いんじゃないの? 本来、lreg は値渡しできるべきだよね。
まぁねぇ。

複雑なものから計算する方が良いってことは、スタックに積む
引数から計算した方が良いってことか。

ま、それはできたとして...

Sat May 15 22:45:30 JST 2004

結局、.cprestore は、最初にないといけないので、include を
使うしかないらしい。

add.s の浮動小数点レジスタが印字されないけど。

Sun May 16 13:58:42 JST 2004

問題はレジスタのsaveだね。使ったレジスタはコード生成の後で
しかわからないので。後方にjmp すればいいんだけど。どんな
風に?

	subu    $sp,$sp,$L_r1_offset
        .cprestroe
        sw      $fp,$L_r1_offset-16($sp)
        sw      $31,$L_r1_offset-160($sp)
	addu    $fp,$sp,$L_r1_offset
	jal    $L_save-$L_save_label*4
	addu    $fp,$fp,$L_fregister_save
	jal    $L_fsave-$L_fsave_label*4
        move   $fp,$sp

 ...
        sw      $17,-12($fp)
        sw      $16,-8($fp)
$L_save:
        j       $31
...
        s.s      $f22,-16($fp)
        s.s      $f21,-12($fp)
        s.s      $f20,-8($fp)
$L_fsave:
        j       $31

みたいな感じにする? すると、必ず$31はsaveすることになるけど。
noreorder しないとだめかも。

この方がコンパクトだけど、
	subu    $sp,$sp,$L_r1_offset
        .cprestroe
        sw      $fp,$_Lr1_offset-16($sp)
        sw      $31,$_Lr1_offset-160($sp)
	j      $L_save
$L_fsave_0:
        move   $fp,$sp

 ...
$L_save:
       ...
        sw      $17,-12($sp)
        sw      $16,-8($sp)
        s.s      $f22,-16($sp)
        s.s      $f21,-12($sp)
        s.s      $f20,-8($sp)
        j       $L_save_0

の方がいいかな。save する必要がなければ、
	j      $L_save
$L_save_0:
        move   $fp,$sp

$L_save = $L_fsave_0

とできるし。

両方作って、時間計る?

まぁ、前者の方が凝っているし、命令数的にも変わらないから、
space factor 的に前者の方が速いんじゃないか?

でも後者の方が簡単だよな。

Mon May 17 01:09:02 JST 2004

さて、アセンブルは通るようになりましたが...

どうも、$0,$1が出てしまう場合があるみたい。これを検出する
手段を作った方が良いね。

あと、int の後のdouble/longlong は、$3 のあと、$5,$6 と
来るみたいですね。

さて、いよいよ、オフセット合わせか。

Tue May 18 13:05:24 JST 2004

なんかレジスタセーブがぼろぼろじゃん。max_reg_var とかが、
ちゃんとレジスタの個数を表すようにしろよ。

Wed May 19 13:49:40 JST 2004

endian に関するコードは、ちゃんとソースにそう書いた方が良いね。

やぁ、なんかEndianが合わないよ。ぜんぜん。

printf に $6,$7 と同じ値を渡しているのに、

    diff test/code-gen-all.gcc.out test/code-gen-all.mc-mips.out
    53,54c53,54
    < code_lrindirect ffffffffffffffc9 37 c8 80
    < code_lrindirect -55 55 200 128
    ---
    > code_lrindirect 37ffffffc9 37 c8 80
    > code_lrindirect 240518168521 55 200 128

となるのはなんでだろう? 37 が overwrite されているのか。
でも、37のポジションは正しいんだよな。37自体はレジスタには
乗ってないし。

Wed May 19 22:15:33 JST 2004

しかし、がんがんバグは取れていくわけだけど、なんか、
微妙にわけわからないバグが残っているな。

MIPSってconst のかけ算ないんだよね。だったら、*4ぐらい
はshiftした方が良いかも。

Thu May 20 21:46:17 JST 2004

register_dassop をテストしてなくて、コードも間違ってる。

chptrsave なんだけど、
     case hoge:
     macro_replace()
で、case hoge: が終了すると、getsymの先読みで、macro_replace
を展開して、そこが lfree ( chptrsave = list2(hoge,chptrsave) )に乗ってしまう。
docase で、lfree = slfree すると、そのlist2 は破壊されてしまう。
つまり、slfree=lfree;.... getsym  ...; lfree=slfree は、正しくない。
なので、list2 じゃなくて、glist2 して、free_glist2 してやるようにする。

でも、そもそも、macro_buffer は、どうなの? その領域は再利用されるのか?
そうでないと巨大なmacroを書かれたときに気まずい。cheap は、malloc
してもいいんじゃないかなぁ。

code-gen-all.c と simp1.c は通ったんだけど、basic.c が微妙に
通らない。なんでかな。diff もね。

Fri May 21 13:09:10 JST 2004

switch なんだけど、long long を通すと落ちるね。

なかなかself compileが通らないな。今度は、getsym か。やっぱり、$gp
関連?

代入文の型が右辺値の型になっていた。こんなバグが、まだ、
残っていたとは。

double register の順序を決めないとdead lock するな。

えーと、double register がconflict しまくるなぁ。
さすがに function では起きないらしいが...
ということは、set_[dl]operand の問題か。

やっぱり register parallel assign を書くのが簡単だよね。

slt/beq ってのが、うまく動いてないみたいね。


Sat May 22 12:49:55 JST 2004

なんか構造体の先頭はレジスタに置くみたいね... いいけど。
$5,$6,$7 か。

continuation frame は、$sp=$fp にするの? 関数引数は
$fpに積んでいるから、そうする必要があるわけだけど。
そうすると$fp を毎回動かさないといけないんだよね。
まぁ、PowerPCでも、そうしているわけだけど。

jal 後に $gp を書き戻すわけだけど、そのアドレスは
決まっているし、毎回セーブする必要もないけど。
$sp 相対だとまずいなぁ。

fmask,mask とかも要らないんじゃないの? そもそも
なんでいるんだろう?

(gdb) x/20i carg1
0x400a80 <carg1>:       lui     $gp,0xfc0
0x400a84 <carg1+4>:     addiu   $gp,$gp,30128
0x400a88 <carg1+8>:     addu    $gp,$gp,$t9
0x400a8c <carg1+12>:    addiu   $sp,$sp,-144
0x400a90 <carg1+16>:    sw      $gp,32($sp)
0x400a94 <carg1+20>:    move    $s8,$sp
0x400a98 <carg1+24>:    sw      $s2,16($s8)
0x400a9c <carg1+28>:    sw      $s1,20($s8)
0x400aa0 <carg1+32>:    lw      $t3,-32692($gp)
0x400aa4 <carg1+36>:    lw      $a0,0($t3)
0x400aa8 <carg1+40>:    lui     $t2,0xf000

というように .cp 関連は変換される。本当は自分でやった
方が良いんだけど。

ブランチは jal みたいには変換されないのか。まずい?

0x400b00 <carg1+128>:   move    $a1,$s5
0x400b04 <carg1+132>:   move    $a2,$s4
0x400b08 <carg1+136>:   move    $a3,$s3
0x400b0c <carg1+140>:   lw      $t9,-32664($gp)
0x400b10 <carg1+144>:   jalr    $t9
0x400b14 <carg1+148>:   nop
0x400b18 <carg1+152>:   lw      $gp,32($s8)

やっぱり sp 相対で $gp はセーブされるのか。jalr と
自分で明示する方が安心か。

  *.i が作られるのは良いが、 .include で
ファイル名がずれる。出力ファイルに相対して
 .i を作るべき。

a.c b.c のようにつなげると止まらなくなる。(-Dのループか?)

結構、比較のバグが残っているじゃん。定数比較でembugしたかもね。

long long の比較は int の比較から作る汎用ルーチンを作った方が
良くない?

つうか、まったく間違ってました。

Sun May 23 17:10:59 JST 2004

やっとMIPSが仕上ったよ。まだ、code jump は、できてないけど。

そもそも external jumpができるかどうか調べてないな。

slt $r1,$r2,12 みたいなコードも出したいが...

parallel_rassign って target=source で無限ループしない?

Sun May 23 21:21:22 JST 2004

やっぱり、boolean の扱いがなぁ。jmpでない方が良いよね。

Mon May 24 07:11:57 JST 2004

関数呼び出しの引数は、やっぱり$spオフセットで積むべきでしょう。
でないと、$fp!=$sp の時におかしくなる。($s8=$fp)

code から大域変数が読めない。

0x401170 <main1>:       lui     $gp,0xfc0
0x401174 <main1+4>:     addiu   $gp,$gp,28352
0x401178 <main1+8>:     addu    $gp,$gp,$t9
0x40117c <main1+12>:    addiu   $sp,$sp,-144
0x401180 <main1+16>:    sw      $gp,16($sp)
0x401184 <main1+20>:    sw      $ra,136($sp)
0x401188 <main1+24>:    b       0x401234 <main1+196>
0x40118c <main1+28>:    sw      $s8,132($sp)
0x401190 <main1+32>:    move    $s8,$sp

0x400aa0 <carg1>:       lui     $gp,0xfc0
0x400aa4 <carg1+4>:     addiu   $gp,$gp,30096
0x400aa8 <carg1+8>:     addu    $gp,$gp,$t9
0x400aac <carg1+12>:    addiu   $sp,$sp,-144
0x400ab0 <carg1+16>:    sw      $gp,32($sp)
0x400ab4 <carg1+20>:    move    $s8,$sp

ですか。$t9 ってなんだろう?

0x401290 <main+48>:     lw      $t9,-32744($gp)
0x401294 <main+52>:     addiu   $t9,$t9,4464
0x401298 <main+56>:     jalr    $t9
0x40129c <main+60>:     nop
0x4012a0 <main+64>:     lw      $gp,16($s8)

これか。ってことは、恐れていた通り、
    printf("\tj %s\n",s);
ではだめなのね。

$t8 は、$25 ってことは、$t9 は$26? jmp先みたいだね。 $jp?
cpload $25 の$25 じゃないの? じゃぁ、
        jrn = register_name(cadr(jmp));
        printf("\tmove $25,%s\n",jrn);
        printf("\tjal\t$31,$25\n");
すればいいのかな?

.ent しないっていう手もあるけど... 外から入って来た時に
どうする? (そもそも、code って、外から呼び出せるの?)

    printf("\tla $25,%s\n",s);
    printf("\tj\t$25\n");

でいいみたいだね。
    1,9d0
    < arg1: 0 1 2 3 4 : 1 1
    < arg1: 1 2 3 4 0 : 1 1
    < args: 1 2 3 4 0 : 1 1
    < 321=0
    < args3: 11 22 33 44 55 : 1 2 3 4
    < args4: 11 22 33 44 55 : 2 3 4 1
    < args5: 66 77 88 99 10 : 3 4 1 2
    < args6: 66 77 88 99 10 : 3 4 1 2
    < args3: 66 77 88 99 10 : 3 4 1 2
    make: [check-code] Error 1 (ignored)
    +pstwo1+kono ./a.out
    arg1: 0 1 2 3 4 : 0 0
    arg1: 1 2 3 4 0 : 0 0
    args: 0 263785888 4200109 2712942 0 : 0 0
    Segmentation fault
ま、いろいろあるね。


0x401180 <main1+16>:    sw      $gp,16($sp)

0x401298 <main+56>:     jalr    $t9
0x40129c <main+60>:     nop
0x4012a0 <main+64>:     lw      $gp,16($s8)

この一貫しないのやめてよ....  $sp!=$fp にすると、$gp がずれて
しまう。call の前に $fp=$sp にするという手もあるが....

結局、自分で、
     lw      $gp,16($sp)
するので解決。

Mon May 24 13:26:54 JST 2004

MIPS の jump は、できました。MIPSはR1SAVEしないのね。R1SAVE
の方が若干安全な気もするが、毎回手間があるのはいただけないよ
ね。

leave で、control が必ず on になるのは何故?

次は、やっぱり、c2cbc でしょう。

(float) f == 1.0  で double に変換しているな。

register oprtc が、
        move $4,$20
        addu $4,$4,16
        move $20,$4
とかなるのは悲しくない?

Tue May 25 05:14:30 JST 2004

indirect jump で、$25 に代入するんだけど、
後ろに廻せば必ず simple になるから、そこでは
$25 に直接代入できるね。move 一つ減るだけだけど。

pcond は、pcond_const を持つべき。

cmp/jcond は、一つで処理した方が良い。switch 文も bne $6,1,$L_11
とかできた方が良いよね。

struct proto tcp_prot = {
        .name           =       "TCP",
        .close          =       tcp_close,
        .connect        =       tcp_v4_connect,
        .disconnect     =       tcp_disconnect,
        .accept         =       tcp_accept,
        .ioctl          =       tcp_ioctl,
        .init           =       tcp_v4_init_sock,

は、便利だよね。あった方がいいよな。(そんなに難しくないし)
ただ、一旦全部リストにしないと格納できないか。混在した場合は
どうなるんだろう? 文句言えばいいの?

やっぱり、難しいんじゃないかなぁ。これって、その場でemit_data/
decl_data できないよね。local の場合はassign の列にコンパイ
ルすることはできるんだけど。global は、assign_data で、なん
かのキューに入れるか。mode を増やすわけね。

decl_data の先頭でgetsymするのはまずいわけね。
            while(t1) {
                offset = decl_data(car(t1),n,offset);  /* alignment? */
                ....
            }
の代わりに、

    getsym();
    if (SYM==DOT) {
      smode=mode;
      sstlist = stlist;
      stlist = 0;
      if (mode!=LOCAL)
	  mode = SNAMEMODE;
      while(sym!=RC) {
	  type = search_struct_type(..&offset1);
	  decl_data(car(t1),n,offset1);
      }
      if (mode== SNAMEMODE)
	  emit_sname_assign(stlist);  // global?
      offset += sizeof(struct);
      stlist = sstlist;
      mode=smode;
    } else {
      while(t1)
	offset = decl_data(car(t1),n,offset);  /* alignment? */
	....
    }
みたいな感じ? nest した場合は、emit_sname_assign でも decl_data
を呼んで、再度キューに入れるしかないか。

Mon May 31 19:08:57 JST 2004

register_assop は、いいんだけど、register_assop_const の
コードが良くないね。

Wed Jun  2 13:12:35 JST 2004

rexpr に value option を付けて、
   code_bool
では、rexpr,drexp を呼んだ方がいいんだけど... && || とかどうする
かな。

あーあ、なんか恥ずかしいミスが残っているね。

Thu Jun  3 13:16:33 JST 2004

code_bool はできたんだけど、まぁ、自己満足だよね。

code_bool で !use の時に、null branchが残っちゃうけど...
ま、仕方がないか。

Fri Jun  4 12:57:28 JST 2004

switch 文をやるんだけど、

       main() {
           int i=3,j=1,k=0;
           switch(i)
               for(;j<10;j++) {
                   case 3: k++; case 2: k++; case 1: k++; case 0: k++;
               }
           printf("%d\n",k);
       }

なんだけど、j<10 などを評価する前にjmpする必要があるので、最
初のcase文にjumpしないといけないが、jump する必要があるかど
うかは、switch の次の文を実際に評価してみないとわからない。

なので、 checkret() で、その処理を行う方が良い。
     if (first_case) {
         jmp(first_case); first_case =0;
     }
かな。もし、これが行われるなら、飛び先はtable jump routine であるべき。

switch をまとめるのはやったけど、現状のコードだとtable
は、ほとんどでないね。2分木は出るけど。IDが連続するように
工夫した方がいいのかな。

chunk の merge のalgorithm だけど.... O(N^2) だよね。

     c0,  c1,  c2, ... cn

で、(なんか見たことある...)

     c0,  c1,  c2, ... cn
     +------------------+ rate
     +---------------+    rate
     +----------+         rate
     +----+               rate
          +-------------+ rate
          +----------+    rate
          +-----+         rate
                   ...

というのを作る。((n-1)*(n-2)/2) か。で、一番、rate の高いものを
取るのが、正しいとは限らない.... rate じゃなくて、cover 率が
高いものの方が良い。消去法が良くて、まず、

     RATE 以下のものを消去する (生成しない)
     そして、cover 率の高いものをとって、すべてを取り尽くす

           +------------+ rate 75%
     +-------++------+    rate 80%

みたいなのをどうするかだけど... テーブルが少ない方を優先?
テーブルが一つが良いとは限らない。

count が多いのに delta が異なると一般的にはだめ。

     +-------++---------+ rate 80%
          <------>   みたいな形で取り合う場合もある。

この場合は cover rate が変わらないので、table rate で計算する?

えーと、生成した全ての区間の組合せが許されるわけではない。

     c0,  c1,  c2, ... cn
     +----+               rate   これが fix すると、
              +---------+ rate
          +-------------+ rate
          +-----+         rate
                   ...           などしか許されない。

後ろから計算しても前から計算してもおんなじはず。
ただ、飛び値が多い場合の計算量がなぁ。

まぁ、やっぱり、

  for i (0..n) {
    c_i を c_n に向かって可能な限り拡大する
    できなかったら、それを生成
  }

でしょ?

まぁ、だいたいできたんだけど、細かいバグが残っていそうだね。

    < # chunks 1 = sum  1/123 sum = 1
    ---
    > # chunks 1 = sum  1/2 sum = 1

なんてのもあるし。

merge が大きい方からやってくようにしちゃったけど、少し、
結果が良くないみたい。人間は、case 1: case 2: ... というように
書くからね。そんなに難しくないはずだが、直すのが面倒。

Sun Jun  6 02:41:27 JST 2004

次はバイナリサーチで、テーブルを生成するコードを書けば良いだ
けだが。2分法だときれいなブランチパターンにならない。8分法ぐ
らいで書くのがいいんじゃないかな。

 case_group_1:
      if (c==case_2) goto case_2 ( or nested case_group )
      if (c==case_3) goto case_3
        ....
      if (c==case_8) goto case_8
      goto default
 case_group_2:
      if (c==case_10) goto case_10
        ...
      goto default
 cslabel:
      if (c==case_1) goto case_1  (*)
      else (c<case_1) goto default
      if (c==case_9) goto case_9  (*)
      else (c<case_9) goto case_group_1 (or table lookup )
      if (c==case_17) goto case_17  (*)
      else (c<case_17) goto case_group_2
        ...
      else goto default;

かな... (*) は、オプション。ない方が良いCPUもあるだろう。MIPSとか。

フラットの方が良い場合もあるはず。(実測する?)

Sun Jun  6 09:39:13 JST 2004

で、nested branch は、どう実装すれば良いの? recursive に
書くんだよね? bottom up に書きたいところだけど。

   #define CASE_INDEX_COUNT 8
   switch_index(int chunk,int *cslist) {
       if (case count > CASE_INDEX_COUNT) {
	   chunk1 = gather_chunk()
       chunk1 = switch_index(chunk,&cslist);

   while(chunks) {
       chunk = switch_index(chunk,&cslist);

ぐらい? (chunk でやるの?!) ...  ん... だったら、merge_chunk
でできるんじゃないの? できるだろうけど、ちょっと複雑すぎるか。

table があるなら、必ず index は必要。

index がtableになることって... 偶然にはあるかも知れないし、
無理にすればできないことはないだろうけど...

Sun Jun  6 23:07:16 JST 2004

level 1 table がおかしい。そうだよなぁ。

今のアルゴリズムだと、10ずつ連続しているテーブルに
少数のanomalyがあるって時に困るね。テーブルが分解されちゃう。
ま、そんなコードないと思うけど。

cmpdimm を直すのを忘れてました。

あと、delta!=1 だと、割算したときの余りが0であることを確認しないと
いけない。gcc では、delta!=1 の表は出さないみたいだね。

あと、行き先が同じcaseは、range check にするとか...
(まぁねぇ。。)

ま、一応はできました。

kernel とか gcc とか compile できると良いけどねぇ。

Mon Jun  7 18:24:27 JST 2004

さて、次は、構造体の初期化か、c2cbc か。mc-tree の分離か。

局所変数の初期化がレジスタ変数であるに関わらずスタックを
初期化しているな。

  gcc -E -c -DCONFIG_TASK_SIZE=4096 -DCONFIG_KERNEL_START=1 -D__KERNEL__=1 tcp_ipv4.c -I../../include > ~/src/device/test/struct_init.c

kernel source は、まだ、早いんじゃない? asm とかあるし。
でも、asm も難しそうではないけどね。

stdarg は簡単なんだけど、初期化用の C source を持っていた方が
良いね。macro だけでなく typedef もしたいよね。

"test" "test" は、macro 中では使えない。っていうか使う必要ない?
どうせ、あとで解釈されるから。

hoge##name みたいなのの扱いだけど... hogefuga に変換されたあと、
また、展開する必要があるんだよね。

初期化ソースは、chptr に代入すると macro processing されない。
macro は、getline で行われるから。うーん。

うーん、line continuation と macro の関係は奥が深いな。
getch が null を返すのを認めれば良いんだけど、他のところの
影響が大きい。

##          l = va_arg(ap,long long);
## (*((longlong *)ap)++)

うーん。macro 関係か。space 除いているの誰だろう?

あ、そうか、register 上の引数は、varargs の場合は、
すべてメモリに入れないといけないわけね。じゃぁ、
浮動小数点か整数かはどうやって判断するの?

Wed Jun  9 10:14:35 JST 2004

切符買わないと。なんか、関数の引数の型のチェックをしてない
みたい。

stdarg できました。struct size のエラーはなに?

えーと、
	alloca
	asm
	struct partial field init
        hoge##name
がないね。というか、これだけ? (頑張れ～)

Thu Jun 10 17:57:35 JST 2004

struct partial field init は、できたんだけど、局所変数の場合
は、不定の部分を0にしているみたいね。つまり、static にとって、
コピーしているみたいね。これは標準的なセマンティクスなのかな?

やっぱり、重複した初期化は許されないのが普通なのか。

skipspc()=='.' だとコメントがスキップされない。ふーむ。
もういいよ。skip flag で。

なんで  macro_expansion が
    c = 1;
    macrop = list2((int)macropp,macrop);
    while(c && (*macropp++ = c = *body++)) {
なんて変なループなんだ?

Sat Jun 12 10:42:15 JST 2004

そうか、inline のために constant switch とかをやると、全体的
に statement をskip するってのを書かないといけないわけね。chk
を使えば良いんだろうけど。それほど、難しくはないけど....

alloca も r1 と $sp を動かしているだけじゃん。

残りは、
       alloca
       inline
       asm
と言うことになりましたが... MIPS のstdargも動いてないけど...
問題は include file の方だものな。

typeof かぁ。
     typeof (hoge) i;
     sizeof(typeof(hoge));
     ((typeof (hoge)) fuga)
みたいな感じ。

なんか g() で、register_save が出ちゃってるね。

Sun Jun 13 12:20:39 JST 2004

ia32 の alloca は、関数の引数に呼び出されるのはまずい。あと、
stack の途中も、まずい。じゃぁ、どうするの?
      a = alloca(3)+3;
      f(i,alloca(3),j);
みたいなのでも破綻しちゃうのね。

powerpc でも結構奥が深いな。関数呼び出し時の引数は、
r1 相対でつまないとだめ。そうだよね。というか、
最初から r1 相対で積めよ。

        lwz r2,0(r1)
        neg r0,r0
        stwux r2,r1,r0
        addi r2,r1,208
        addi r0,r2,15
        srwi r0,r0,4
        slwi r0,r0,4
        stw r0,208(r30) <=== 最初のlocal 変数のアドレス。
        b L26
L25:
        li r0,0
        stw r0,208(r30)
L26:

ってわけか。

うーん、
      int i;
      goto f(alloca(100),&i);
なのってあるよね。だとすれば、local 変数はつぶさない方が
いいのか。その方が簡単か。そうすると絶対に local 変数と
goto の引数は重ならないから parallel assignment の必要
ないし。なんで、最初からそうしなかったんだろう?

しかし、そうするにはどこ直せば良いんだろう? max-func-arg?

まぁ、取り合えず、alloca と goto は両立しないってことで
いいんじゃない? 一段、subroutine はさめば良いだけだしね。

Mon Jun 14 20:48:13 JST 2004

PowerPC の alloca は動いたけど...

Tue Jun 15 10:47:53 JST 2004

やっぱ inline の方が asm macro より先? asm macro も constraints を
限定すればそんなに難しくないと思うけど。

inline は、本当は CSE とか flow 解析とかやらないといけないんだけどね。

ただ、inline するのが良いかは CbC との相性によるよな。

というわけで、asm が先の方がいいんじゃない?

ia32 のswitch 文がおかしくなってるぞ。

Wed Jun 16 13:05:40 JST 2004

asm は、({....; val;}) も一緒に実装しないとだめ。あと、
local_decls での redefined だけど、なんかいい方法あるの?
無視ってもいいんだけど...

association list を使って、unwind すれば良いんだけどね。
それは、全体的に手直しした方が良い。後回し。

cheap の扱いで boundary を見てないのがいつくあるね。

Thu Jun 17 17:10:21 JST 2004

えーと、
    "m" とかは、メモリの変更なので見なくてよろしい
    "r" はレジスタを割り当てる
    "=" は出力のマークなので無視して良い
    "+", "&" は出力のマークなので無視して良い
で、
    "0"   0番目のoperand
とかなんだけど... こいつは input (先にコンパイルする方)
に現れる。だから、output operand を先に処理する。out
put operand は単純な代入文だから、それでOk。

Fri Jun 18 13:33:19 JST 2004

なんか、%0,%1 とかって、同じレジスタに割り振られることも
あるみたいね。さらに、連続してでて来るとも限らないみたい。

ってことは?

なんか、間違えた。%0...%8 は、パラメターの順序を
さしているのね。そうだよな。

Sat Jun 19 00:17:33 JST 2004

asm は終りました。まぁ、ia32とかMIPSとかは、独自な問題が
あるんだろうけど。

Sat Jun 19 06:40:30 JST 2004

label がfunction localになってないみたい。

builtin_expect かぁ。

bit field が少しある見たい。

結局、全部、実装しないとだめか。
     q = (struct spin_lock) { };

とか。

    typedef struct __wait_queue wait_queue_t;

    struct __wait_queue {
	    unsigned int flags;
       ...
    };

って言う感じで typedef の struct が後だしジャンケンされてしまう。
後ろの struct def は、typedef された型名を知りようがない。うん。
0 なら、type に nptr が入っているので、それのfiled listを探せば良い。

やっぱbit filedしないとだめか。どうするのかな。type の拡張?

bit field 実装したくないよ～

まぁ、構造体の代入と同じような形にすれば良いわけだけど。

bit field の初期化ってのもあるのか。(うげ～)

うーん、やっぱ、果てないな。
    ASSOP, PREINC, POSTINC....
まぁ、
    BASSOP, BPREINC, BPOSTINC....
でもいいんだけど。

Sun Jun 20 20:21:38 JST 2004

どうも、mc-parse に、mc-codegen に相当する部分がかなり入り込んでいる
みたいだね。これを移すのはめんどくさいが... binop とか、もともと
mc-codegen にあるべきものなのか。

でも、これをしないと、構文に対応した構文木を取れないわけか。
inline で、構文木を再評価する場合もあるからなぁ。再評価した
場合に、構文木レベルで変更するべきなのか、コード生成レベルの
木でやるべきなのか、という問題もあるわけか。

macro も分割した方が良いね。

Mon Jun 21 00:29:12 JST 2004

mc-tree は、もう時代遅れ。切り離した方が良い。
conv も、だめなんじゃない?

なんか、随分、変えちゃったな。動かすのが大変そう。

できるだけ static にするんだけど...
     mc-codegen からだけ参照される mc-parse.c のextern
ってのが C では表現できない。一旦、extern すると使われてなくても
何にも言わなくなるから。

mc-codegen の使っている変数のうち、どれがstaticなんだが検出できない。

emit_data_closing の場所が変。

Tue Jun 22 01:05:09 JST 2004

ようやっとリカバリできたよ。

local scope { int hoge; ... { int hoge;... }} for(int i=0; hoge...)
は、やらざるを得ないだろうね。

Tue Jun 22 06:49:55 JST 2004

bit-field の alignment は、アーキテクチャによって任意って
感じだな。

MIPS

01:ffffffffffffffff
02:fffffff0 0000001f 00000000 00000000 00000000 00000000 00000000 00000000
02:00000000 00000000 ffffffff 00000001 00000000 00000000 00000000 00000000
02:00000000 00000000 00000000 00000000 ffffffff 00000001 00000000 00000000
01:ffffffffffffffff
02:fffffff0 000fffff 00000000 00000000 00000000 00000000 00000000 00000000
02:00000000 00000000 ffffffff 0000ffff 00000000 00000000 00000000 00000000
02:00000000 00000000 00000000 00000000 ffffffff 0000ffff 00000000 00000000
1:ffffffffffffffff
2:fffffff0 0fffffff 00000000 00000000 00000000 00000000 00000000 00000000
2:00000000 00000000 ffffffff 00ffffff 00000000 00000000 00000000 00000000
2:00000000 00000000 00000000 00000000 ffffffff 00ffffff 00000000 00000000

PowerPC

01:ffffffffffffffff
02:0fffffff f8000000 00000000 00000000 00000000 00000000 00000000 00000000
02:00000000 07ffffff fc000000 00000000 00000000 00000000 00000000 00000000
02:00000000 00000000 03ffffff fe000000 00000000 00000000 00000000 00000000
01:ffffffffffffffff
02:0fffffff fffff000 00000000 00000000 00000000 00000000 00000000 00000000
02:00000000 00000000 ffffffff ffff0000 00000000 00000000 00000000 00000000
02:00000000 00000000 00000000 0000ffff ffffffff 00000000 00000000 00000000
1:ffffffffffffffff
2:0fffffff fffffff0 00000000 00000000 00000000 00000000 00000000 00000000
2:00000000 00000000 ffffffff ffffff00 00000000 00000000 00000000 00000000
2:00000000 00000000 00000000 00000000 ffffffff ffffff00 00000000 00000000

実装は、mc-parse.c では決められないのか。

まず、
        boundary を含めて読み込み (必ず指定された型のサイズに収まる)
次に、
        読み込んだ部分の指定されたbitを置き換え
           まず 0 にして、置き換えと or を取る(?)
そして、
        書込
って感じですかね。64bit はめんどくさいな～

ってことは、
       and mask をつくって、or mask をつくって、
       逐次実行
って感じですか。はぁ～。

BIT_FIELD のsizeをやらないと、初期化ができない。

Wed Jun 23 14:06:10 JST 2004

(昨日は飲みすぎ...)

emit_data は、mc-codegen にあるべきだよね。

bit_field の大域変数の初期化ができない。いったん、どっかに
貯めないとだめ。assign_data level?

なんか、assign_expr の 引数 type が大域変数を上書きしてました。
それが恥ずかしいバグの原因だったのか。

Fri Jun 25 00:00:46 JST 2004

なんか、Union のテストコードを書いてない気がする。
Union は、間違ってました。

bit field はできました。

なんか MIPS のgccは、bit field にバグあるみたいだね。

Fri Jun 25 11:30:30 JST 2004

3249,3252c3249,3251
<     //  n = get_register_var(0);
<     g_expr_u(assign_expr0(n,list2(ADDRESS,cadr(e2)),INT,INT));
<     e4 = rvalue_t(list2(INDIRECT,rvalue_t(n,INT)),type);
<     g_expr(assign_expr0(list2(INDIRECT,rvalue_t(n,INT)),
---
>     g_expr_u(assign_expr0(n,list2(ADDRESS,e2),INT,INT));
>     e4 = rvalue_t(list2(INDIRECT,n),type);
>     g_expr(assign_expr0(list2(INDIRECT,n),
3255,3256c3254
<     if (car(n)==LVAR) free_lvar(cadr(n));
<     else if (car(n)==REGISTER) free_register(cadr(n));
---
>     free_lvar(cadr(n));

なんだけど、lassop あたりでも問題ありそう。

bassop を呼び出す BPOSTINC で、post の処理をさぼってます。

っていうか、bassop は間違っているじゃん。

bassign だったら、読み出してbit replace で良いんだが、
op をかけるんだったら、bit_field として読み出して、
一旦、整数値にしてから計算しないとだめ。

post の処理は複雑なので専用のを書いた方が良い。

    if (simple) {
	tmp_var = bit_field
	tmp_var op= operand
	bit_field = new_var
    } else {
	address = lvalue;
	tmp_var = address->bit_field
	tmp_var op= operand
	address->bit_field = new_var
    }
    if (post) tmp_var;

ですかね。

Fri Jun 25 14:49:57 JST 2004

もう少し複雑だった。でも、終りました。codegen level で
終るのは良いよね。

まぁ、bit-field も、

     constant assign の時の最適化 (and/or mask の計算)
     1 bit の時の特別命令を使う?
     bit.r == 1 を、and 0x100 にコンパイルする

とかいろいろやることはあるけど、意味ないよな...

Sat Jun 26 16:32:57 JST 2004

で、local 変数の扱いだけど....

    大域変数、局所変数、タグ名、フィールド名、型名、ラベル

とあるわけだよね。で、スコープを任意にしたいわけだ。

     nptr を、局所->局所->大域 にlinkするようにすれば良い

malloc するようにする? それともlinkするようにするか。

うーん、hash 計算無しで lsearch しているところがあるな。
hash は別関数になってないし。


Sun Jun 27 10:58:04 JST 2004

大した変更してないけど、ia32 code がバグった。

Sun Jun 27 14:52:59 JST 2004

is_memory のバグでした。

そういえば、double register pair のparallel assignmentって
やってる?

うーん、やっぱり、codegen が register pair を知ることが出来
るように、list2(LREGISTER,high,low) みたいな形にしたいよね。
なんで、だめなんだったっけ?
	list2(DREGISTER,list2(REGISTER2,high,low))
	list2(LREGISTER,list2(REGISTER2,high,low))
	list2(FREGISTER,list2(REGISTER,high))
とか?
	list3(REGISTER,1,reg);
	list3(DREGISTER,2,reg,reg);
	list3(FREGISTER,1,reg);
かな。

いいんだけど、変更多くない? でも、use_reg とかの複雑さを考えると、
そうした方がいいんじゃないかなぁ。

でも、変更多いよね。利点としては、regs[] を lregster 分取らなくて
すむことかな。でも、本当に簡単になるのかな?

code_*() でレジスタを使っている部分を修正する必要があるから、
かなり大きな変更になるのか。でも、code_*() に引き渡す変数と
構文木中の要素が同じになるのは重要だよね。

構文木でのレジスタ変数のユニークさを維持しないと、
    if(r!=reg)
        printf("\tmr %s,%s\n",register_name(reg),register_name(r));
    return;
みたいなのが困るね。ということは reverse poiner がいるってこ
とか。

overlap を見るときに、自分自身が overlap していても問題ない。
ただし、重ならないようにコピーしないとだめ。そうしないと、
巨大な構造体を二回コピーするはめになる。

      |---||--------------|

           |--------------||---|

      |--------------|     |---|

      |--------------||---|

みたいな感じだね。これは、まだ実装してないんだよね。

Sun Jun 27 21:06:28 JST 2004

やっぱり、name/namebuf 関連は書き換えるんでしょ?

まず、get_name/get_string  は、cheap 上にコピーする。
で、new_def でなかった時には cheap を元に戻す。
name, namebuf は、なくす。

  string hash (oblist) ->  hash table ->
    nptr -> macro/reserve/local/global/typedef etc

となる。local nptr は、local_scope list に登録し、
scope を抜けるときに消す。

get_name/string でt既に登録してしまう。gserach/lsearch/msearch
は、登録されたhash からのlinked list で良い。gsearch も linked
list にする必要がある。nptr には、next をつける?

あぁ、ARM には fpp はないのね。いや、GBAにはないけど、
Zaurus にはあるっていうパターン?!

ってことは... MIPS と PowerPC を足して二で割ったような実装
をしないといけないのか。うーむ。

macrobuf は、cheap で共有できるはず。そうすれば、linebuf 以外は
一つになる。linebuf も一緒にできるかな? それは、無理なんだけど...
cheap なんだけど、extendable にするためには...

     struct cheap {
         char *cheap;
         char *last;
	 struct cheap *next;
     }

として、これへのポインタをcheapとして用いれば良い。cheapp とかが
あるので、やっかいだが..

Mon Jun 28 20:18:03 JST 2004

あのさ、それをやっちゃうと、chptr も cheap を参照するんだから、
そっちも、直さないとだめじゃん。

いや、それはない。mappend で、必ず cheap chunk に収まるはず
だから。結構、無駄が出る可能性もあるけど、別にいいんじゃない?
巨大に展開した macro の最後の方だけ cheap からはみでるとか。
だからどうなの? 2M とかに展開されるわけでもないだろ?

mappend で chunk boundary にかかると copy で append を
壊してしまう。どうせ、cheap rest してから、chptr を
切替えるんだからいいんだけどさ。

Tue Jun 29 17:36:36 JST 2004

  #define car(a) heap[a]
だけど...
       typedef struct tree {
          int id;
          int next;
       } TREE;
として、
   #define as_tree(a) (TREE)(heap[a])
	  TREE t = tree(a);
	  if (t.id == HOGE) {....
っていうようにアクセスする手はあるよね。
   #define tree(a) ((TREE)(heap[a]))
	  if (tree(a).id == HOGE) {....
でもいいか。

conservative に変えたいのか、drastic に変えたいのか
どっちだよ。


name space は、tag, macro, その他? typename は重なっていてはいけない。
field も別だけど。sc で区別するわけだけど...

hash_search が返すのは name spcae assoc だよね。

巨大なname があると、 macro 展開された chptr を上書きする可能性がある。
             cheap->ptr         chptr
    |--------|-name1-| |-name2-|pppppppp|
             cheap->ptr         chptr
    |--------|xxxxxxx| |-name1-name2-|--|
先までコピーしてやればいいんだけど...
                                     chptr
    |--------|xxxxxxx| |-name1-name2-|pp| |pppppp|

でも、chptr は、boundary にかかることはないんだから、こういうことは
起きないんじゃないの? chptr はかからなくても、cheap->ptr は、かかる
可能性があるか。

これのコピーを実装して、mappend ではpage 転送しないようにすれば、
mappend で reset_cheap しても良い。

Thu Jul  1 20:28:49 JST 2004

    { int hoge;
        { int hoge; ....} }
だけど。。。

異なるレベルだってのをどうやって見つけるの?  define case は、
わかるから大丈夫か。なんかオプションいるの?

   hash -> name_space -> nptr
           global (typename, global, function)
           tag
           field
           local -> name_space
		    label
                    tag
                    field

であるべきだよね?

Fri Jul  2 06:46:27 JST 2004

こんなに変更しちゃって、動くわけないよね。

単体テスト書く?
    cheap
    hash
ぐらい?

やっぱり、大変だわ。あと、もう少しだとは思うけど。

Fri Jul  2 23:38:14 JST 2004

あと、もう少し..

セルフコンパイルのバグがとれないよ。

もしかすると、void fuga(b,d,e,f) { return hoge(a,b,c,e) ;  }
っていうプログラムで完全に、tail recursion するなら、
CbC と、おんなじなんじゃない? (条件は?)

その方が簡単か? いや、関数呼び出しと互換性を維持しないといけない
ので、やっぱり、こっちの方が難しい。レジスタのセーブとかあるし。

そうか、I2C, I2S, U2UC, U2US が必要なみたいだね。それに応じて、
    code_i2c
    code_i2s
    code_u2uc
    code_u2us
がいるのか。

endian 特有の問題なのか。じゃぁ、hash のバグとは関係ないのね。

K&R argument が redefined 扱いで、新しい変数になって
しまう。

Sat Jul  3 15:16:50 JST 2004

ようやっと recovery できました。

global heap の拡張は難しいよね。特に、heap の使い方が
割りと雑な今は難しい。nptr,heap,local ともinteger で
アクセスするならともかく。

また、くだらん、gcc の拡張か... 使うなよ... __label__

やっぱり、型名は大域変数とは別な名前空間だよな。

まぁねぇ。 code が、結構、コンフリクトしているな。ま、そうだけど。

三項演算子の一部を省略できるのか。

いくつか問題はあるが、kernel source は、通りました。

Sun Jul  4 19:17:02 JST 2004

arg の中に関数があって、それがさらに関数引数を持っていると、
それがdefineされてしまう。それが使われるとEXTRN1になって、
未定義関数になってしまう。

とりあえず、こんなものかな。

あとは、
         inline
         c2cbc converter
ですね。

inline は高く付きそうだけど。

inline をマクロで実装するのは比較的簡単なんだよね。だけど、
c2cbc を考えると、やっぱり、構文木で実装するべきでしょ?

global heap は拡張可能じゃない? local heap がない時に、
やばそうだったら拡張してしまう。realloc でいいし。
pointer とっているのは scope だけじゃないか?

うーん、やっぱり、global heap の拡張は、それほど単純じゃない
みたいね。


41c41,43
< int args,init_vars,heap[HEAPSIZE];
---
> int args,init_vars;
> int *heap;
> static int HEAPSIZE = HEAPSIZE0;
236a234,245
> void
> clear_lfree()
> {
>     if (gfree>HEAPSIZE-LHEAPMARGIN) {
> 	HEAPSIZE *= 2;
> 	heap = realloc(heap,HEAPSIZE*sizeof(int));
> 	if (!heap) error(MMERR);
> 	fprintf(stderr,"heap extended to %d\n",HEAPSIZE);
>     }
>     lfree= HEAPSIZE;
> }
> static void
331a353,354
>     if (!heap) heap = (int *)malloc(HEAPSIZE*sizeof(int));
>     if (!heap) error(MMERR);

ぐらいではぜんぜんだめ。

別に問題なくできるじゃん。なにやってんだ?

LDECL の中間 nlist って本当にいるの? こんなのがあるから、中
間の nptr を一つ無駄にしているんだよね。make_local_scope だ
けで良いんじゃないかな。macro は、それで動いているわけだし。

なんか、struct が、ちょっとだめなみたいだな。type名がlocal
になってしまうから?

なんか、type と tag をglobalにするので通ったけど... scope
に関しては、もう少しテストを書かないとだめだな。

Mon Jul  5 14:11:07 JST 2004

local label ね。まぁ、簡単なんだけど...

lazy flag で、
     do if
       make l = listN(IF,cond,then,else)
       if(lazy)
            return l;
       else
            eval_if l;
     eval_if
みたいな感じ?

Tue Jul  6 17:46:50 JST 2004

type と tag を大域にするんじゃなくて、tag だったら大域、
type は、LTDECL のみで局所っていうようにするべきだよね。

static が global になっちゃってるな。

あ、いけない、なんか壊しちゃったよ。。。

bit field って

	e4 = rvalue_t(e2,type);
	g_expr(assign_expr0(e2, list4(BFD_REPL,e4,e3,t), type,type));

なんだけど、これだと、
        e2 を出力して、push して、
        e2 をもう一回読み込んで load
        そして replace
        pop して assign
って感じなんだよな。別にいいんだけどさ。
        e2
        load
        replace
        store
っていうようにしたいんだけど。

でも、この部分って long long も通っているから変更するとなると
量が多いんだよな。

GVAR + offset が、list2(INDIRECT,list2(ADD..)) に展開されるので、
simple の方にもっていかれない。ということは、GVAR を GVAR + offset
という構成にした方が良いってことだよね。

list2(GVAR,nptr) なんだけど、これを、list2(GVAR,nptr,0)
にすれば良い? まぁねぇ。あんまり使われないとは思うけどね。
実際、出るコードは変わらないし。

結構、複雑。複雑すぎるんじゃないの?

Wed Jul  7 23:19:35 JST 2004

できたけど、mips の register usage がおかしい。もっと
レジスタを使えるはず。

save_stack で、regisiter を解放するのを忘れてました。

parallel_rassign では、一つ解放したら、そこを他の依存ループ
を解決するのに使うのが良い。けど...

どうも、余計に extsb しているみたいだな。

本来は必要な時に変換するべきだよね。でないと、
       lbz
       extsb
       stb
しちゃうから。

Thu Jul  8 02:31:03 JST 2004

ARMは、どうもadd, sub は、8bit 幅で定数を持てるみたいね。

table がmax-min を16bit だと仮定しているみたい。倍数を
含んでいるときは、その限りでない。

Fri Jul  9 14:45:56 JST 2004

LDECL は、disp < 0

const も実装しないといけないんだよな～

arm は、大域変数を、
        ldr     r3, .L28+88
    ....
.L29:
        .align  2
.L28:
        .word   i1
        .word   i2
        .word   s1
        .word   s2
        .word   us1

みたいな形で間接参照するわけだけど、参照した順にリストに格納しないと
だめ? 変数表に格納したい所だが... make scope で出来ないかな?
linear list で持ってもいいんだけど。

ptr_cache の方でリストを持てば?

なんか、add # の意味が良くわからないよ。別に常にメモリ
参照で問題はないんでしょ?

良くわからないけど、
      8bit 幅の定数で、シフトが2ずつ
みたいな感じ?

でいいけど、どんなアルゴリズムで生成するんだよ。

    8bit mask を2ずつシフトして、
      残りが取れるかどうかをみる

えーと、16x8x8 ぐらいのオーダ?
    for(sign=-1;sign<=1;sign+=2) {
	if (sign==1) d = c; else d = -c;
	for(i=0;i<32;i+=2) {
	    if (!(im=mask8(d,i)))  continue;
	    id = d - im;
	    if (id==0) goto found;
	    for(j=i+8;j<32;i+=2) {
		if (!(jm=mask8(id,j)))  continue;
		jd = id - jm;
		if (jm==0) goto found;
		for(k=i+8;k<32;k+=2) {
		    if (!(km=mask8(jd,j)))  continue;
		    kd = jd - km;
		    if (km==0) goto found;
		}
	    }
	}
    }
	emit_const(c);
    found:
	if (sign==1) emit_add(im,jm,km);
	else emit_sub(im,jm,km)
ですかね。1024 ループか。。。 const 毎に?

しかも、その中で、もっとも短い命令を探さないとだめなのか。

pointer offset も、そうなのかな? (その可能性はあると思う)

12*8*4 = 384 ぐらいか(最悪で)

    sub mask8 {
	my ($d,$bit) = @_;
	$d & (255 << $bit);
    }

    sub make_const {
	my ($c) = @_;
	my ($sign,$im,$jm,$km);
	my ($min_stage) = 4;
	my ($msign,$mim,$mjm,$mkm);
	for($sign=1;$sign>=-1;$sign-=2) {
	    my $d;
	    if ($sign==1) { $d = $c; } else { $d = -$c; }
	    last if ($min_stage==1);
	    for(my $i=24;$i>=0;$i-=2) {
		$jm = $km = 0;
		next if (!($im=mask8($d,$i)));
		my $id = $d - $im;
		if ($id==0) {
		    $min_stage=1; $msign = $sign;
		    $mim = $im;$mjm = $jm;$mkm = $km;
		    last;
		}
		next if ($min_stage<=2);
		for(my $j=$i-8;$j>=0;$j-=2) {
		    $km = 0;
		    next if (!($jm=mask8($id,$j)));
		    $jd = $id - $jm;
		    if ($jd==0) {
			$min_stage=2; $msign = $sign;
			$mim = $im;$mjm = $jm;$mkm = $km;
			last;
		    }
		    next if ($min_stage<=3);
		    for(my $k=$j-8;$k>=0;$k-=2) {
			next if (!($km=mask8($jd,$k)));
			$kd = $jd - $km;
			if ($kd==0) {
			    $min_stage=3; $msign = $sign;
			    $mim = $im;$mjm = $jm;$mkm = $km;
			    last;
			}
		    }
		}
	    }
	}
	if ($min_stage<=3) { emit($sign,$im,$jm,$km); }
	else { print "emit const $c\n"; }
    }

ぐらいでした。

Sun Jul 11 12:54:26 JST 2004

やっぱりlarge offset はうまく動いてないみたいね。

local global table は、12bit offset(+sign 1bit) だから4096/4
で1000命令毎には出力する必要がある。しかも、既に出力されてい
るものは、前のを使う必要がある。なるほどね。っていうことは、
テーブルにそういうフラグをつけないとだめか。(それぐらい
アセンブラでやってよ～)

すべてのprintfにcounter をつければ良いわけだけど、いくつかは
問題があるだろうな。ちょっと量多いしね。

ARMには short ってないのか。short を多用しているプログラムは
だめなのね。

(でも、どっちかって言うとテスト環境を作る方が難しそう)

slとかipとか思い入れがありそうなレジスタの名前も大した意味がある
わけではないらしい。

ARMって、なんかsigned char とunsinged char の区別がないな。

lvar offset が、ちょっとめんどくさいかな。
constant が決まってないから、せっかく作ったcode_add
が使えない。いや、決まるのかな?

Sun Jul 11 20:37:20 JST 2004

やっぱり、local variable のオフセットがその場で定数でないのは
まずい。

                     負の値
         fp          <-------|
   +------+------------------+
          <----lvar_offset--->

なのがまずいんだよね。

          負の値
         fp------->          |
   +------+------------------+
          <----lvar_offset--->

にすれば良いだけだよね。なんけど、def で pre decrement しているが
まずい。が、<0 でないとまずいので、単純な post decrement でもだめ。

でも、これ修正量が多いよね。

          負の値
         fp------->          sp----->
   +------+------------------+
 callee   <----lvar_offset--->  caller
   arg                            arg
   <------> pre known offset
   ---->

と、直せば良い。

ん、だが....

                       <------r1_offset------------------------------>
                                                 <-lvar_offset------->
 r+  +------------+---+-------+------------------+--------------+----+    -
      callee arg   xx   local   register save       caller arg     xx
                        disp      reg_save          max_func_args*SIZE_OF_INT
        lvar>0          lvar<0                      lvar>0x1000 0000
                      r30                                            r1

とするのは、PowerPC では変更が大きすぎる。レジスタセーブする場所
が良くわからないし。

もしかして、register save 領域は固定?!


Mon Jul 12 05:35:33 JST 2004

うーん、やっぱり、難しいよな... 何故か、printf が local variable
を壊してしまう。

register save 領域は固定なわけきゃないだろ。最初からやり直して、

 function call stack frame
                      <-------r1_offset------------------------------>
                                      <------------lvar_offset0------>
                      <--lvar_offset-->
 r+  +------------+---+---------------+----------+--------------+----+    -
      callee arg   xx   register save   local      caller arg     xx
                          reg_save      disp       max_func_args*SIZE_OF_INT
        lvar>0                         lvar<0       lvar>0x1000 0000

ということになりました。frame の設定のところだけ無条件に32bit add
になったが仕方ないな。これだと、callee arg は不定オフセットにならざる
を得ない。reg_save が最後まで決まらないから。

はぁ。大変なのはPowerPCだけで、MIPSとia32 は、そのまま動くというのが
わかりました。

Mon Jul 12 12:54:14 JST 2004

が、結局、MIPSを $fp からの裸オフセットにするのは苦労したね。
  .frame $fp じゃなくて、 .frame $sp にすると動くのか。
あと、goto 関連は、
    code_environment
    code_fix_frame_pointer
    leave
の三つを直さないとだめなのね。

この変更は、ARMのオフセット計算を固定オフセットで行うために
やっているんだけど、ARMのレジスタセーブを固定領域にすれば、
あるいは、どこかに追いやれば、callee arg も含めて固定に出来
るはず。


なんか浮動小数点レジスタは f4 だけみたいね。

	    mov	ip, sp
	    stmfd	sp!, {r4, r5, r6, r7, r8, r9, sl, fp, ip, lr, pc}
	    sub     fp, ip, #4
	    sub     sp, sp, #12
    .L3:
	    ldmea	fp, {r4, r5, r6, r7, r8, r9, sl, fp, sp, pc}
    .Lfe1:

まるで、6809 の PSHS X,Y,D だね。PULS X,PC とか。

なんだけど、これだと、

                      <-------r1_offset------------------------------>
                                      <------------lvar_offset0------>
                      <--lvar_offset-->
 r+  +------------+---+---------------+----------+--------------+----+    -
      callee arg   xx   register save   local      caller arg     xx
                          reg_save      disp       max_func_args*SIZE_OF_INT
        lvar>0                         lvar<0       lvar>0x1000 0000

にならざるを得ない。となると、どっちかは、不定オフセットだな。
ま、callee 側でしょう。ま、これに習うか。あるいは、ポインタ
で指してもいいんだよね。ていうか、reg_save に関わらず決まった領域
をとっちゃえばいいんじゃない? 大した量じゃないし。浮動小数点
レジスタも一つだしね。

もう少しかかりそうだね。

Wed Jul 14 12:45:01 JST 2004

やっぱり浮動小数点ありとなしを一緒に実装するのはめんどい。

あれ、? mc-code-mips.c の
    rexpr_bool(int e1, int reg)
    {
	int e2,reg0;
	int op = car(e1);
    return 0;

ってなんだ? せっかく作ったのに?

ちょっとバグってました。でも、なんでだろう? logic miss がある?

drexpr_bool for MIPS は作ってないみたいね。long long はさすがに
大変そうだし。

double/long long の定数だけどさ、
    local const table  に連続して入れる
    大域領域に初期化して、そこへのポインタをlocal const table に入れる
でいいんだけど... 前者だと、searchがめんどい。後者だと、double load
になるので、なんか嫌。たまたま一致した0を使えないのもなんかね。

adr なんて言うのがあるのか。adr して ldmia ってなんか変。mvfs #0
なんてのがあるのか。0,1,10 があるのがわかるけど...

float の switch ってあるの?

(はぁ、めんどくさい... 一週間かかってるし...)

Sun Jul 18 20:45:48 JST 2004

なかなか終らないね。GBAとLinux Zaurus と両方だからな。
(やっぱ ARM に手をつけたのは失敗でした)

alloca の引数が定数の場合をやってないね。

まだ、先長そう。でも、やりたかったんだから、仕方ない。

浮動小数点レジスタ一つっての嘘だな。レジスタは使うたびに、
毎回セーブするみたいね。

Wed Jul 21 13:51:56 JST 2004

さて、inc_inst を、どうやっていれるか....

copmpile error は取ったけどさ。

Fri Jul 23 13:28:24 JST 2004

なんか頭が回らないな。

Sat Jul 24 19:27:55 JST 2004

うん。mc-arm で構文エラーがでるのは、なんかを壊しているから
なんだけど、それを直接にデバッグするのは、あんまり良い方法
じゃないんだろう。この程度のエラーを自動的に見つけてくれるのが
欲しいよ。


Tue Jul 27 13:45:21 JST 2004

.L183:
        mov     sl, r9
.L178:
        mov     r9, sl
.L175:
        mov     sl, r9
.L172:
        mov     r9, sl
.L169:
        mov     sl, r9
.L166:
        mov     r8, sl
.L163:

これねぇ。

まぁ、でも、なんとなく戻って来たか。

ぼろぼろだなぁ。論文も書かなきゃいけないのに。

Thu Aug 12 14:15:40 JST 2004

ちょっと間あいたね。ARMも、もう少しだけど、c2cbc の方を先に
しないと。C++ からの変換はどうする? cfront って動くのかな?

(あんな論文書いちゃって...)

Mon Aug 16 17:27:17 JST 2004

COND は、できるだけ CREG_REGISTER を使うようにしたけど、
アドホックだね。(まぁねぇ)

CONDのテストが入ってないなぁ。

Tue Aug 24 15:39:27 JST 2004

register 割当てが変。ほとんどをregister var に割り当てるように
なっているけど、もっとtmpがないと計算できないよね。

Thu Sep  2 20:46:56 JST 2004

そういえば Input register をtmpに使わないのはなんで?

順調にバグ取りは進んではいるんだけど...

Sat Sep  4 18:04:40 JST 2004

INPUT/REGISTER が double int register と float register
で一貫してない。

Wed Sep  8 01:08:35 JST 2004

lvar_offset_label, r1_offset_label っているの? fp を
使ってるんだから、いらない説もあるが..

局所変数を負のオフセットでアクセスし、関数呼び出しをsp オフセット
で積むなら、いらないはず。

Sat Sep 11 15:13:33 JST 2004

やっぱり、CSE ぐらいやるべきじゃない? マクロで生成されるとねぇ。
   if (o==H1||o==H2|o==H3)
みたいなものね。まぁねぇ。

でも、そうすると、asm がなぁ。でも、そうすると elimination
もやりたいよね。

それよりは、inline が先か。

Tue Sep 14 14:36:15 JST 2004

arm lvar のlarge offset をなんとかしないと。lvar intro
でなくてもできるはずだよね。

だけど、ptr cache と const list
を一般的に一緒にできない? 両方ともconstだしねぇ。

そうか、ptr cache は外にでちゃっていて、nptr を前提にしている
ので、ちょっと難しい。uniq nptr を当てはめてやればよいみたい
だけど...

        str     r1, [fp, #0+.L3]
        str     r2, [fp, #4+.L3]
なんだけど、L3 が巨大なのでだめになってしまう。(まぁ、そうだよね)
まぁ、でも、L3 は巨大にはならないんじゃない?

Wed Sep 15 16:50:46 JST 2004

basic のレジスタに載った引数をスタックに戻すところがおかしい。


そうか、C++ のmaglegationをいれれば、C++ とは接続可能。
だけど。


Wed Oct 13 21:06:31 JST 2004

mvn は1's complement で、sub は2's complement なみたいね。
なので、8bit const の時におかしくなる。

32bit word のalignmentは4でなくてはならないらしい。

0x20005cc <code_lvar_address+216>:      str     r0, [r11, -#22]
(gdb) p $r0
$13 = -1073742791
0x20005d0 <code_lvar_address+220>:      ldr     r0, [r11, -#22]
(gdb) si
(gdb) p $r0
$15 = -63324161
(gdb) p (char*) -1073742791
$16 = 0xbffffc39 " \004@L
(gdb) p (char*)-63324161
$17 = 0xfc39bfff <Address 0xfc39bfff out of bounds>
(gdb) quit

うーむ。

Fri Oct 15 08:46:59 JST 2004

        mov     ip, sp
        stmfd   sp!, {fp, ip, lr, pc}
        sub     fp, ip, #4
        sub     sp, sp, #16
        str     r0, [fp, #-16]    引数1
        str     r1, [fp, #-20]    引数2
        str     r2, [fp, #-24]    引数3
        str     r3, [fp, #-28]    引数4
           ...
        ldr     r2, [fp, #4]      引数5
        add     r3, r3, r2
        ldr     r2, [fp, #8]      引数6

そうか。レジスタの引数分はメモリには取られないで、局所変数側
におかれるらしい。spは、stmfd で自動的に調製されるから、sub sp
は局所変数分だけ。fp の#4は戻り番地だけ?

でも、それだと va_next が困るんだけど。

Fri Oct 15 20:51:19 JST 2004

        mov     r3, #0
        str     r3, [sp, #0]
        mov     r3, #1069547520
        add     r3, r3, #3145728
        ldr     r0, .L28+388
        adr     r1, .L28+392
        ldmia   r1, {r1-r2}     @ double
        bl      printf

ってわけで、またがったdouble/longは、半分だけレジスタに置かれる
みたいね。

Sat Oct 16 19:12:31 JST 2004

ま、それは直ったんだけど、register は、input register 以外は
全部 save しているみたいだな。frame あわせがめんどくさい。

cmf f4,#0が、f4 が初期化されてないと落ちるみたい。illigal instruction
っていうけど、 f4 の値によるのか?

fdecl_struct(int fntype)
{
   ...
        mode=ADECL;
            args = 0;
            def(&str_ret);
            struct_return = list3(list2(LVAR,str_ret.dsp),sz,type);
            caddr(fnptr->ty) = glist2(POINTER,caddr(fnptr->ty));

なんだけど、これって save_input_register されてLVARになるわけ
だよね。def した時にはレジスタに割り当てられる可能性もあるよね。
そういうことはないのか。

で、mc-parse.c で、
    if (struct_return) {
       ...
                gexpr(list4(STASS,rvalue(car(struct_return)),e,e1),0);

ってなるわけだよね。

で、mc-code-arm.c では、引数のdspが変更されるからだめなわけね。(スタック
に割り当てられてないから)

だから、struct_return を save_input_register で修正する必要がある。

ARMでは、register割り当て分がstackに取られてないので、struct_push
で、その分をregister にcopyしないとだめ。でも、そうすると、受け側
はどうするの?
        mov     ip, sp
        sub     sp, sp, #8
        stmfd   sp!, {r4, r5, fp, ip, lr, pc}
        sub     fp, ip, #12
        sub     sp, sp, #96
あ、こんなことやってるし～

Sun Oct 17 13:13:00 JST 2004

なんか long long に関しては、gcc の方が結構、間違っているなぁ。

signed char に関しては、ldrsb ってのがあるみたいね。なんで、
arm-linux-gcc ではでないんだろう?

Mon Oct 18 00:15:05 JST 2004

self compile が通らない。他のテストを優先するべきか。

Mon Oct 18 20:25:16 JST 2004

emit_copy の offset の扱いが一貫してないらしい。
あと、 powerpc でr3,r4,r5 を使った状態でmemmoveが呼ばれるみたい。

うーん、やっぱり構造体をレジスタに割り振るのってかなりめんどう
なのね。特にネストする関数では...

構造体はstack上で必ず align されるらしい。

ARM の bitield なんだけど  |---====|=====|====----| と三つにまたがるのが
許されるみたいだね。char でも |--===|===--| があるし。ってことは、かなり
変えないとだめだてことだなぁ。あなあきでなければ、割りと正しく動くんだけど。

残りは、stdarg と bitfield だけか。まぁ、いいんじゃない? stdarg は、
stdarg.h を自分で作れば良いみたい。

Tue Oct 19 11:12:16 JST 2004

また、? のエラーか。
##      mode=(s==STRUCT?GSDECL:GUDECL);
# 1287: : creg=r4 freg=f0
        ldr     r4, [fp, #4]
        mvn     r7, #6
        cmp     r4, r7
        bne     .L713
        mov     r7, #2
        b       .L714
.L713:
        mov     r7, #3
        mov     r0, r7
.L714:
        ldr     r7, .L709+4
        str     r0, [r7, #0]
テストルーチンが必要だね。

(MIPSとかPowerPCとか、だいぶ壊しちゃったみたい...)

C との呼出しがずれている(やっぱりレジスタ?) mc と gcc のオブジェクトを
混在させるとだめだね。

浮動小数点関係の Endian がおかしい

Tue Oct 19 19:07:57 JST 2004

        stmfd   sp!, {r4, r5, r6, r7, r8, r9, sl, fp, ip, lr, pc}

ってわけで、r0-r3 がinput registerで、r4-sl がregister_var とtmp
を兼ねるわけだね。r4から全部をregister_var に割り振ると破綻するだろう。

ってことは、一時変数ではなく積極的にレジスタ変数を使った方が
良いわけだけど...

save_stack で register var はsave する必要はない。けど...

longlong_lib で creg は RET_LREG になっていたけど、その外で、
emit_pop_free する時に、その一部がRET_LREGと重なっていて、
一緒にfreeされてしまう。そうすると、次のemit_popで、上書きされてしまう。
なので、RET_LREGにしないで、lmove してしまうのが良い。

align がおかしい

Sat Oct 23 23:33:11 JST 2004

struct を使った interface をregister にmapするかどうか。まぁ、
難しいけどね。

やっぱりarmのbitfieldを合わせるのは止めた方がいいんじゃない?
long long 以外は、型を大きくして対応できる。long long のはみ出し
は、ちょっと対処できない。
      a:8 =>  a0:4<<4+a1:4
      a:8 = hoge =>    a0:4 = hoge<<4, a1:4 = hoge;
というように分解する?

Sun Oct 24 14:19:13 JST 2004

code_frame_pointer と code_environment は同じなんですけど...

巨大な構造体を並列代入すると、

自分自身が重なっている
   |----------|
       |----------|

では、
   |----------|
            --copy-> |----------|
     他のものを代入
            <-copy--
       |----------|
ってことになる。

これは、ちょっと手間が大きい。
   |--|---|---|
       |--|---|---|
と分割する(分割が細かくならない?)
   |---|--|---|
       |---|--|---|

分割はだめだね。自分自身しか重なってないのだったらoverappable copy
する。
   |----------|----------|----------|
       |----------|----------|----------|

circular dependency はrecursive callする必要はないね。

なんか、構造体が一度、スタックにあげられてから戻されているみたい

RSTRUCT って、本当にいるの?

なんか、「まだ、emit_copy が間違っている!」

PowerPC は、code のレジスタに割り当てられた分のスタック上の引数
を割り当てているな。なので、
## code carg6(int i, int j,int k,int l,struct arg args0)
##     goto carg3(args0,args0,i,j,k,l);
で、args0 のcopyが余計に出るね。 しかもずれ方が変。(*)

無害ではあるんだが...

でも、それでバグを見つけたわけか。

だいぶ、enbug しちゃったよ...

emit_copy でmemmove する時には、offset は無視する。address + offset
から、reverse に address までコピーするという意味だから。

memmove は、一時レジスタを壊してしまうので、parallel assignment
の一時には普通のレジスタは使えない。

PowerPC の code segment で、引数が、CALLER_ARG つまり、関数呼び出し
のスタックと重なっている。code_disp_offset では調整できないらしい。
今までは、(*) のせいで余計に一時変数を取っていたので顕現しなかった
らしい。

うーん... 一応、直ったけど...

他のがどんどん動かなくなる...

Mon Oct 25 03:13:48 JST 2004

codegen で、jump しているのだけど、そこでは、offset -1 で、
局所変数となる。局所変数をそのままcode_segment の引数に
しているらしい。

code_segment側でも、同じoffsetで処理するが、ARMの場合は、
offset 0- -xx までは、register save が入る。それを書き潰し
してしまうらしい。goto 時に。で、戻ったときにerrorとなる。
register は全部、save するので、差はわかっているので、それを
足せば良いだけだけどね。(これ、前もやったな...)

Mon Oct 25 19:36:16 JST 2004

なんか、できた。

まだ、レジスタ分のオフセットがcode_segmentで取られるのは直してない。
ARM の bit field の穴塞ぎもね。

あとは、
       inline
       CbC2C
       C2CbC
だけだね。

Wed Oct 27 08:48:37 JST 2004

MIPSのallocaは、$spを移動するので、j の後の、code segement の
        lw      $gp,$L_41($sp)
はまずい。が、通常は、
        lw      $gp,$L_41($fp)
が出る。だから、alloca で$gpを移動する必要はない。しかし、code_segment
で alloca は使えない。$gp をswしなおせば?

input interface 構造体の alignment を64にすれば、マッチする可能性が
ちょっと高くなる。

const がレジスタに既にあるかどうかをチェックする? ま、いらないか。

ARM の bitield
    |---====|=====|====----|
    |--===|===--|
は、mc-codegen 側で対処しない? char/short/int は -> short/int/long
にすれば良いわけだよね。

問題は、long だけ。はみだすのはintだってわかっている。

bit_filed
	bit_field(upper) << offset + bit_filed(lower)

bassign
	bit_filed(upper) = value >> offset;
	bit_filed(lower) = value << (32-offset-size);

bassop ....

やっぱだめだめ。

bit_filed の前に、読み込みの段階で
     upper2 << offset + (lower&mask >> 32-offset-size)
するか。

bit_field_repl,bit_filed_repl_const はそのままで、
代入するときに、二回 replace する。

おんなじことか。

** そうではなくて、

long でintが余ったときの確保する場所(int)(bitfield_opt)をstack上に用意する。
(new_lvarでしょうね) get_register_var でもいいけど... ARM では意味ない
だろうな。

     mc-codegen:bit_field では、load する時に、bitfield_opt にもload
     code_bit_field では、必要ならば、bitfield_opt から値を読む

     mc-codegen:bassign では、load する時に、bitfield_opt にもload
     mc-codegen:bit_field_repl では、必要ならば、bitfield_opt も置換する
     代入時には、忘れずにbit_field_opt も書き込む

     mc-codegen:bassop では、tmp1 を読むときにbitfield_opt にもいれる

でいいんじゃない? 虚しいが...

Thu Oct 28 17:40:35 JST 2004

それだと変更点が多すぎる。long long でバウンダリがまたがる時
には、格納type を struct { int [3]; } として、一時領域に格納
する。実際には、アドレスが帰って来ることになる。で、code_bit_
replace_const などでは、アドレスに対して処理すれば良い。そう
すれば、codegen 側の変更は(ほとんど)なくなる。

でも、そうすると格納型と値型を区別しないとまずいね。

Fri Oct 29 04:19:58 JST 2004

code-* 側にはtypeの内部構造とかを渡すのは良くない。

あとは、格納型>値型の時のbitの値の修正だな。

この手のbit-field って、本来なら、inline で *C* で記述されるべき
ものだよね。

Fri Oct 29 20:30:41 JST 2004

できたけど.... bassign の中のsassignでアドレスが狂うバグが
あるらしい。本来は、余計なコピーがあっても、害はないはず
なんだが、
diff test/bitfield.gcc.out test/bitfield.mc-arm.out
1058c1058
< 2:00000000 00000000 00000000 def00000 56789abc 00000234 00000000 00000000
---
> 2:00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000
と言う形で、上書きしてしまう。

dum()をはさむと直ったしするのでレジスタのメンテナンスの
問題らしいが...

大域変数のptr cacheが、jump のinput argument regsiter を
壊してしまう。ARM以外はどうして壊さない? 単にレジスタ
使用の順序の問題で、でる可能性はあるってことか。
jump の中でusig_reg すれば良いんだけど。

get_input_register* でcodeの場合だけ using_reg しちゃったけど、
いいのかな?

あっと、goto の浮動小数点レジスタ渡しをあまりテストしてないね。

bitfield は、アドレス渡しで、代入しない方が良いね。

Sat Oct 30 17:48:18 JST 2004

いいんだけど変更がきつい...

  a = b = c = 0

で、a は定数代入にはならないのね? 通常はいいんだけど、bitfield
とかでは余り良くないね。

Sat Oct 30 20:39:34 JST 2004

MIPS の$4,$5,$6,$7 は引数渡しに使われるわけだけど、
6,7にlong long が入るときには、$5 には、$6 と同じ値が入る?
いや、bitfield1.c の printf の %lld が %d になっていただけでした。

ARM の lreg でregsiter が lost するのを止められない...
use_input_reg(int reg,int mode) ってやっぱり、おかしいよね。

なんか、直すのに5時間もかかったよ。

ARM では、use_int/use_longlong の繰り返しで lreg がlost する
らしいのだが、他のmips/powerpc では、そういうことは起きない。
なんでだろう?

Wed Nov  3 18:31:28 JST 2004

やっぱり構造体をint単位に分解すると並列代入は良くなるね。し
かし、それだと、巨大な構造体ではコンパイル時間がかかりすぎる
のと、コードがでかくなってしまう。

並列代入も、もう少し考えるべきだな。
   code f(int a,struct b) {
       goto g(b,a);
   }
みたいな場合だね。

分解してから、もう一度、memcpy にまとめるという手もあるけど...
代入ベースではなくて、swap base の置換にする?
   for(i) swap(a[i],b[i]);
みたいな感じ?
   code f(struct a,struct b) {
       goto g(b,a);
   }
みたいな場合は、そんなのが望ましいが...

分解して巡回依存を解消して、address でsort すれば... memcpy
は検出できるはずだけど...

あ、そうか、巡回依存は、基本的にswapで解決できるはず。
    copy(a,b)
    swap(a,b)
の組合せで、最適な結果が得られるはず。そうすれば、saveとか
をしなくてすむ。
     (a,b,c) <= (b,c,a)
は、
     swap(a,b); swap(c,a);
となる? あれ?

case triple
       a     b       c
     |---||-----||---------|
        b       c        a
     |-----||---------||---|

うーん、

     circular_dependency =>   smallest dependent element
                              singleton or not

     swith(circula_depent(&small)) {
     case CIRCULAR_DEPEND:  save(small); remove(small); break;
     case DEPEND_SINGLETON:  memcpy(small); break;
     default: continue; // try another
     }

これだと、a がsave, b がsaveで、c がsignleton ということになる。
いや、b もsingleton になるかな? b&c を一つのmemcpyにまとめる
のは、それほど意味はないが...

これでも、
case eq
         a          b
     |---------|---------|
         b          a
     |---------|---------|
は、save code が出てしまう。また、上の場合でも、a がでかい場合
があるよね。本来、
     one integeter save
で全部できるはず。(お手玉swap) で、分解すればお手玉swap codeは出る。

memcpy するためには、その先を全部saveしないとだめ。だから、memcpy
とは両立しない。うん。だから、swap operation にするのが良い。が、
case triple をswap operation で解決する方法が良くわからない。
       a     b       c
     |123||45678||9abcdefgh|
     |-23||45678||9abcdefgh| {1}
     |423||-5678||9abcdefgh| {1}
ってな感じかぁ。これは、space/operation trade off なの?
       a     b       c
     |123||45678||9abcdefgh|
     |-23||45678||9abcdefgh| {1}
     |4-3||15678||9abcdefgh| {2}
     |45-||12678||9abcdefgh| {3}
     |456||-2378||9abcdefgh| {1}
     |456||7-318||9abcdefgh| {2}
     |45678||-12||9abcdefgh| {3}
     |45678||9-2||3abcdefgh| {1}
     |45678||9a-||31bcdefgh| {2}
     |45678||9ab-||12cdefgh| {3}
     |45678||9abc-||23defgh| {1}
     |45678||9abcd-||31efgh| {2}
     |45678||9abcde-||12fgh| {3}
     |45678||9abcdef-||23gh| {1}
     |45678||9abcdefg-||31h| {2}
     |45678||9abcdefgh||-12| {3}
     |45678||9abcdefgh||1-2| {3}
     |45678||9abcdefgh||12-| {3}
     |45678||9abcdefgh||123| {-}
       b        c        a
で、できるにはできるんだが....

これと、memcpyとどっちが速いかはアーキテクチャとmemcpyによる。

だから、
    ある程度、小さい構造体は分解
    大きなものは、singleton/smallest detection をまずやる
    save が大きすぎるときには、circular dependent 内部でお手玉を出す
ってな感じですかね。

お手玉なんだけど、
       a   b       c
      |-||---||-------|
      123456789abcdefgh
       a b1    c     b2    c_t + c_s をswap
      |-||||-------||-|
      123459abcdefgh678
      b2 b1    c     a     a_t + b2  をswap
      |-||||-------||-|
      678459abcdefgh123
        b     c      a     b2,b1 をswap
      |---||-------||-|
      456789abcdefgh123
ってな感じで大きなものからswapかな。こうすれば自動的に分割される
ので、分解は必要なくなる?

     circular_dependency =>   smallest dependent element
                              singleton or not

     swith(circula_depent(&small,&large_conflict)) {
     case CIRCULAR_DEPEND:
	if (size(small) < SAVE_MAX) {
	    save(small); remove(small); break;
	} else {
	    swap_divide(large_conflict);
	    reposition(conflict);
	    remove(large);
	    break;
	}
     case DEPEND_SINGLETON:  memmove(small); break;
     default: continue; // try another
     }

     swap:     ld  r0,(to);
               ld  r1,(from);
               st  r0,(from++);
	       st  r1,(to++);
               if (cnt-->0) goto swap

って感じ? swap された最後が、どういうパターンになるかは、ちょっと
面白い問題だけどね。

Thu Nov  4 10:15:29 JST 2004

あ、なんか long long の定数シフトで > 32 の場合を忘れているね。

Fri Nov 12 15:37:42 JST 2004

やっぱり、record (taged union) は欲しいよね。

    struct {
       enum {hoge0,hoge1,hoge2} i;
       switch(i) {
       case hoge0: struct {...} b;
       case hoge1: struct {...} c;
       case hoge2: struct {...} d;
       }
    } a;

    assert(a.i==hoge0);
    a.b.j = 3;
    assert(a.i==hoge0);
    printf("%d\n",a.b.j);

うーん、あんまり良くないなぁ。これだったら、いらないよね。

Fri Nov 12 15:59:32 JST 2004

Template あるいは型変数は入れたくないよね。入れるとしても、
上位言語だろうなぁ。

Sat Nov 13 11:05:06 JST 2004

main() { printf("%d,%d\n", -555>>3,-555/8); }
-70,-69

なるほどね。

なんか arm-linux-gcc がバグっているな...

    ltosop_register()
    {
    register long long i1,i2,i;
    register unsigned long long u1,u2,u;
    u1 = 632423423; u2= 32394234;
    u = 0;
        ....
    u = u1 & u2;
    printf("#2052:ltosop r u 6 %llu\n",u);

        sub     r6, fp, #48
        ldmia   r6, {r2-r3}
        sub     r7, fp, #48   <---?!
        ldmdb   r7, {r6-r7}
        and     r2, r2, r6
        and     r3, r3, r7
        sub     r7, fp, #64
        stmia   r7, {r2-r3}
        ldr     r0, .L640+92

なんでかね。

Sun Nov 14 15:59:33 JST 2004

よし、inline やるか。

   inline function (or parsed tree)
       list4(INLINE,name,type)
   declaration (argument, local, static)
       list4(DECL,next,type,name)        done by def (?)
   statement
       list3(IF,next,list3(cond,then,else))
       list3(DO,next,list2(cond,while))
       list3(FOR,next,list4(A,B,C,body))
       list4(SWITCH,next,expr,body)
       list3(COMP,next,body)
       list2(BREAK,next)
       list2(CONTINUE,next)
       list3(CASE,next,label)
       list3(RETURN,next,expr)
       list3(GOTO,next,expr,env)
       list3(ASM,next,list4(A,B,C,D))
       list3(LABEL,next,label)
       list3(COMMENT,next,comment)  (?)

 (1) make inline tree
 (2) evaluate inline function (copy and partial evaluation)
author	kono
date	Sun, 14 Nov 2004 23:50:11 +0900
parents	d92786033042
children	626d705471d5