Mercurial > hg > Members > masakoha > testcode
annotate regexParser/TODO @ 289:20ed7536784f
add test file
author | Shinji KONO <kono@ie.u-ryukyu.ac.jp> |
---|---|
date | Mon, 01 Feb 2016 10:30:55 +0900 |
parents | 2f3e7bba038e |
children | 1b75546ff65f |
rev | line source |
---|---|
289 | 1 Mon Feb 1 01:51:10 JST 2016 kono |
2 | |
3 非決定性がある時の maxmum match がよろしくない | |
4 これ以上拡張できないという終了条件の実現は? | |
5 | |
6 ./regexParser -ts -subset -regex '(a|b)*a' -file ahoaho.txt | |
7 | |
8 で、bの後にaが来なくなると、bの手前までをacceptする | |
9 | |
10 | |
11 | |
284 | 12 Sun Jan 31 20:37:49 JST 2016 masa |
289 | 13 並列処理時のバグ Ok |
14 (mili|have) のsubset construction のミス Ok | |
15 tSearch の segv Ok | |
284 | 16 |
289 | 17 '(main|int) ' .. Ok |
18 '(main|int)\(' .. Ok | |
287 | 19 |
20 とかが動かない。 | |
21 | |
221 | 22 Sat Jan 2 15:29:16 JST 2016 kono |
23 | |
24 stateよりもstate transitionの方が大きいので、subset contructionで CharClassWalkするのは良くない。 | |
25 mergeTransition した時に、state listに新しいものを接続してやれば、CharClassWalkの必要はない。 | |
26 その時に、stateArray には入れないでおく。sateArrayは処理済みなので。 | |
27 | |
28 EOF stateには cc がないので特別扱いする必要がある。 | |
29 | |
30 Tue Dec 29 17:55:17 JST 2015 kono | |
215 | 31 |
32 Todo は上に付け加えていく。 | |
33 | |
34 abc*d + | |
35 / \ | |
36 + d | |
37 / \ | |
38 + * | |
39 / \ | | |
40 a b c | |
41 | |
42 Parserを書き換えて、 | |
43 | |
44 abc*d + | |
45 / \ | |
46 a + | |
47 / \ | |
48 b + | |
49 / \ | |
50 * d | |
51 | | |
52 c | |
53 | |
54 とすることもできる。たぶん、こっちの方が良い。でも、 | |
55 ((ab)(c*))d | |
56 と書いても良いはずで、しかも、これは abc*d とおなじになるので解決になってない。 | |
57 | |
58 sub treeは、最初の状態を返す必要がある。そうでないと、 | |
59 (ab*|bc*) | |
60 とかがうまく動かない。 | |
61 | |
62 最後が*で終わっている時には、次の式と重ねる必要がある。なので、 | |
63 最後の*があれば、それを持ち歩く | |
64 方式が良いと思います。 | |
65 | |
66 stateAllocateをgenerateTransitionは1 passにすると stateArrayの大きさを徐々に増やす必要がある。 | |
67 少なくともループは一つにした方が間違いが少ないだろう。 | |
68 | |
210
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
69 |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
70 2015年 12月27日 日曜日 19時31分03秒 JST |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
71 例題 特定の IP のアクセス数をカウントする |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
72 concordance |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
73 regex をつかった条件付き concordance |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
74 regex をつかった条件付き wordcount |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
75 これを行う perl スクリプトと比較 |
215 | 76 |
77 2015年 12月26日 土曜日 18時07分00秒 JST | |
78 TODO CharClassWalker の routine test を作成する | |
79 TODO CharClassMerge の routine test を作成する | |
80 TODO searchBit の routine test を作成する | |
81 TODO subsetConstraction の routine test を作成する | |
82 |