Mercurial > hg > Members > masakoha > testcode
annotate regexParser/TODO @ 287:2f3e7bba038e
fix \
author | Shinji KONO <kono@ie.u-ryukyu.ac.jp> |
---|---|
date | Sun, 31 Jan 2016 22:59:59 +0900 |
parents | 5d23dc02f60d |
children | 20ed7536784f |
rev | line source |
---|---|
284 | 1 Sun Jan 31 20:37:49 JST 2016 masa |
2 並列処理時のバグ | |
3 (mili|have) のsubset construction のミス | |
4 tSearch の segv | |
5 | |
287 | 6 '(main|int) ' |
7 '(main|int)\(' | |
8 | |
9 とかが動かない。 | |
10 | |
221 | 11 Sat Jan 2 15:29:16 JST 2016 kono |
12 | |
13 stateよりもstate transitionの方が大きいので、subset contructionで CharClassWalkするのは良くない。 | |
14 mergeTransition した時に、state listに新しいものを接続してやれば、CharClassWalkの必要はない。 | |
15 その時に、stateArray には入れないでおく。sateArrayは処理済みなので。 | |
16 | |
17 EOF stateには cc がないので特別扱いする必要がある。 | |
18 | |
19 Tue Dec 29 17:55:17 JST 2015 kono | |
215 | 20 |
21 Todo は上に付け加えていく。 | |
22 | |
23 abc*d + | |
24 / \ | |
25 + d | |
26 / \ | |
27 + * | |
28 / \ | | |
29 a b c | |
30 | |
31 Parserを書き換えて、 | |
32 | |
33 abc*d + | |
34 / \ | |
35 a + | |
36 / \ | |
37 b + | |
38 / \ | |
39 * d | |
40 | | |
41 c | |
42 | |
43 とすることもできる。たぶん、こっちの方が良い。でも、 | |
44 ((ab)(c*))d | |
45 と書いても良いはずで、しかも、これは abc*d とおなじになるので解決になってない。 | |
46 | |
47 sub treeは、最初の状態を返す必要がある。そうでないと、 | |
48 (ab*|bc*) | |
49 とかがうまく動かない。 | |
50 | |
51 最後が*で終わっている時には、次の式と重ねる必要がある。なので、 | |
52 最後の*があれば、それを持ち歩く | |
53 方式が良いと思います。 | |
54 | |
55 stateAllocateをgenerateTransitionは1 passにすると stateArrayの大きさを徐々に増やす必要がある。 | |
56 少なくともループは一つにした方が間違いが少ないだろう。 | |
57 | |
210
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
58 |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
59 2015年 12月27日 日曜日 19時31分03秒 JST |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
60 例題 特定の IP のアクセス数をカウントする |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
61 concordance |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
62 regex をつかった条件付き concordance |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
63 regex をつかった条件付き wordcount |
e8aa8a1ea749
add benchmark TODO
Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
parents:
204
diff
changeset
|
64 これを行う perl スクリプトと比較 |
215 | 65 |
66 2015年 12月26日 土曜日 18時07分00秒 JST | |
67 TODO CharClassWalker の routine test を作成する | |
68 TODO CharClassMerge の routine test を作成する | |
69 TODO searchBit の routine test を作成する | |
70 TODO subsetConstraction の routine test を作成する | |
71 |