Mercurial > hg > Papers > 2014 > toma-master
annotate paper/chapter3.tex @ 70:0b1a059c49fa
fix
author | kono |
---|---|
date | Thu, 13 Feb 2014 12:08:24 +0900 |
parents | d15c924e9089 |
children |
rev | line source |
---|---|
64 | 1 \chapter[Haskellによる並列データベースの実装]{Haskellによる\\並列データベースの実装}\label{ch:impl} |
48 | 2 本章では, 並列データベース Jungle の実装について述べる. |
10 | 3 |
4 \section{木構造データベース Jungle} | |
47 | 5 非破壊的木構造データベース Jungle は, Haskell で実装された並列データベースである. |
6 非破壊的木構造の方法に則った関数を提供する. | |
23 | 7 |
47 | 8 % 本研究では, HTTP サーバ Warp と組み合わせて掲示板システムとして利用しているが, 他のシステムに組み込むことも可能である. |
9 Jungle の基本的な使い方の手順について説明する. | |
23 | 10 \begin{enumerate} |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
11 \item{木構造を保持する Jungle を作成する} |
23 | 12 \item{Jungle 内に新しい木を名前をつけて作成する} |
47 | 13 \item{木の名前を用いて, ルートノードの取得を行い, データを参照する} |
14 \item{もしくは, 木の名前を用いて, ルートノードの更新を行う} | |
23 | 15 \end{enumerate} |
16 | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
17 \subsubsection{Jungle が持つデータ型} |
49 | 18 非破壊的木構造データベース Jungle が持つのデータ型を表\ref{tab:components}に表す. |
64 | 19 |
20 \begin{table}[htbp] | |
21 \begin{center} | |
22 \begin{tabular}{|c|c|c|} \hline | |
23 型名 & データ構造 & 概要\\ \hline | |
24 Jungle & Jungle (TVar (Map String Tree)) & 木と木の名前を管理 \\ \hline | |
25 Tree & Tree (TVar Node) String & ルートノードの管理 \\ \hline | |
26 Node & Node (Map Int Node) (Map String ByteString) & 子と属性を任意の数持てる\\ \hline | |
27 \end{tabular} | |
28 \end{center} | |
29 \label{tab:components} | |
30 \caption{Jungle が持つデータ型} | |
31 \end{table} | |
49 | 32 |
65 | 33 TVar というのは, Transactional variablesの略で, STM で管理する変数に対して利用する. |
34 | |
47 | 35 木構造の集まりを表現する Jungle, 単体の木構造を表現する Tree がある. |
36 Node は子と属性を任意の数持てる. | |
49 | 37 データ型として定義することで, 内部の型の整合性が保たれる. |
38 例えば, Node の1つ目の型は (Map Int Node) となり他の型は許されない. | |
39 非破壊的木構造データベース Jungle のデータ型について, ひとつずつ説明する. | |
35 | 40 |
60 | 41 \clearpage |
42 \section{Jungle} | |
47 | 43 Jungle は木構造の集まりを表現する. |
49 | 44 木には名前がついており, Tree の情報と一緒に保持している(ソースコード\ref{src:jungle}). |
35 | 45 |
49 | 46 \begin{lstlisting}[label=src:jungle, caption=Jungleのデータ型の定義] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
47 data Jungle = Jungle { getJungleMap :: (TVar (Map String Tree)) } |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
48 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
49 |
47 | 50 Jungle のデータ構造は, Jungle (TVar (Map String Tree)) である. |
62 | 51 |
47 | 52 getJungleMap :: というのは, Haskell のレコード構文である. |
53 レコード構文は, データ構造へのアクセサを提供する. | |
49 | 54 getJungleMap は関数で, ソースコード\ref{src:getjunglemap}の型を持つ. |
47 | 55 これは, Jungleを受け取って, TVar (Map String Tree)を返す関数である. |
56 レコード構文はデータ型を受け取って, :: の右側の型の値を取り出せる関数を作成すると思えば良い. | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
57 |
49 | 58 \begin{lstlisting}[label=src:getjunglemap, caption=getJungleMap] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
59 getJungleMap :: Jungle -> TVar (Map String Tree) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
60 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
61 |
47 | 62 Jungle の木の取り扱いには, Haskell の Data.Map を利用している. |
63 Map は, 連想配列を扱うことのできるデータ構造である. | |
64 平衡木を用いて, 挿入や参照が O (log n)で済むように設計されている. | |
60 | 65 Data.Mapを理解するためにはリストで考えると分かりやすい(ソースコード\ref{src:map_list}). |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
66 |
60 | 67 \begin{lstlisting}[label=src:map_list, caption=リストで定義した場合のMap] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
68 data Map k a = Map [(k,a)] |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
69 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
70 lookup' :: Eq k => k -> Map k a -> Maybe a |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
71 lookup' k (Map []) = Nothing |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
72 lookup' k (Map ((k',a):xs)) = if k == k' |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
73 then Just a |
62 | 74 else lookup' k xs |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
75 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
76 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
77 insert :: k -> a -> Map k a -> Map k a |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
78 insert k a (Map x) = Map ((k,a):x) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
79 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
80 test = Map [("key","value"),("fizz","buzz")] |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
81 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
82 |
47 | 83 Map は, キーと値のペアのリストだと考えることができる. |
84 キーが一致する値を探す場合, lookup'を用いる. | |
85 Maybe モナドを用いて, データがなければ Nothing, データがあれば Just に包んで返す. | |
62 | 86 |
87 lookup' の定義を見ていく. | |
47 | 88 $=>$ の前にある, Eq kは, 型クラスの制約である. |
89 内部で k と k' の同値性をテストしているため, k は同値性をチェックできる型クラス Eq に属している型である必要がある. | |
62 | 90 lookup'では, 見つからなかった場合にまだ見ていないリストの残りを再度lookup'に渡して探す. |
91 Haskell ではこのような再帰的な関数定義をよく使う. | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
92 |
47 | 93 新たにキーと値のペアを, Mapに追加するには insertを用いる. |
94 Haskell では, 受け取った引数を変更することができないため, ペアを追加した新しい Map を返す. | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
95 |
62 | 96 木と木の名前の Map は Haskell のソフトウェア・トランザクショナル・メモリ (STM) を利用して状態を持たせ, スレッド間で共有できるようにしてある. |
47 | 97 これは, 各スレッドから木構造を新たに作成できるようにするためである. |
34 | 98 |
23 | 99 \subsubsection{Jungle と木の作成} |
49 | 100 Jungle は, 複数の非破壊的木構造を持つため, Map で木を管理している(図\ref{fig:jungle}). |
101 Tree には名前がついており, 複数のバージョンの Tree のノードのどれが最新かという情報を持っている. | |
10 | 102 |
23 | 103 \begin{figure}[!htbp] |
104 \begin{center} | |
49 | 105 \includegraphics[scale=0.7]{./images/jungle_type.pdf} |
23 | 106 \end{center} |
107 \caption{複数の木を扱えるJungle} | |
108 \label{fig:jungle} | |
109 \end{figure} | |
10 | 110 |
62 | 111 木の名前, つまり Map の キー にはString を利用する. |
112 String は Haskell の文字列の型で, 1文字を表す Char のリスト [Char] の別名である. | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
113 |
49 | 114 Jungle を作成するには, createJungle を用いる(ソースコード\ref{src:createJungle}). |
47 | 115 empty は空のMapを作成する関数である. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
116 |
49 | 117 \begin{lstlisting}[label=src:createJungle, caption=createJungle] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
118 createJungle :: IO Jungle |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
119 createJungle = atomically $ do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
120 map <- newTVar empty |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
121 return (Jungle map) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
122 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
123 |
49 | 124 createJungleは, 新たにSTMの変数を作成する newTVar を実行する. |
125 newTVar などの STM の操作は STM モナド内で行う. | |
126 最後にatomicallyを行うことで, do 構文内がトランザクションとして実行される. | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
127 |
60 | 128 ソースコード\ref{src:createJungle}の atomically の隣にある \$ は関数適用演算子である. |
47 | 129 \$ 関数は最も低い優先順位を持っており, 右結合である. |
49 | 130 括弧を減らすのに使う. \$ を使わない場合はソースコード\ref{src:dollar}の様に記述することになる. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
131 |
49 | 132 \begin{lstlisting}[label=src:dollar, caption=関数適用演算子を使わない場合] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
133 createJungle :: IO Jungle |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
134 createJungle = atomically (do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
135 map <- newTVar empty |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
136 return (Jungle map)) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
137 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
138 |
47 | 139 createJungle は, IOを返すため使う際には main に関連付ける必要がある. |
23 | 140 |
60 | 141 \clearpage |
142 \section{Tree} | |
47 | 143 Jungleが保持する木の情報は, 内部的には Tree というデータ型で保持している. |
49 | 144 Tree は木の名前と, ルートノードの情報を持っている(ソースコード\ref{src:tree}). |
47 | 145 実際にユーザがJungleを利用する際は, Jungle と木の名前を使ってルートノードを取ってくるため, Tree という構造は見えない. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
146 |
47 | 147 ルートノードの情報はスレッド間で状態を共有する必要がある. |
62 | 148 スレッドセーフに取り扱う必要があるため, Haskell の ソフトウェア・トランザクショナル・メモリ (STM) を用いて管理している. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
149 |
49 | 150 \begin{lstlisting}[label=src:tree,caption=Treeのデータ型の定義] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
151 data Tree = Tree |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
152 { rootNode :: (TVar Node) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
153 , treeName :: String } |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
154 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
155 |
49 | 156 新たな非破壊的木構造を作るには, createTree を用いる(ソースコード\ref{src:createTree}). |
47 | 157 createTree は, createJungleで作成した Jungle と木の名前を String で受け取る. |
10 | 158 |
49 | 159 \begin{lstlisting}[label=src:createTree, caption=createTree] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
160 createTree :: Jungle -> String -> IO () |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
161 createTree (Jungle tmap) tree_name = atomically $ do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
162 map <- readTVar tmap |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
163 tree <- emptyTree tree_name |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
164 writeTVar tmap (insert tree_name tree map) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
165 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
166 emptyTree :: String -> STM Tree |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
167 emptyTree tree_name = do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
168 node <- newTVar emptyNode |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
169 return (Tree node tree_name) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
170 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
171 emptyNode :: Node |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
172 emptyNode = Node (empty) (empty) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
173 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
174 |
62 | 175 createTreeも STM を操作するため IOを返す. |
176 createTree 関数では, まず始めにJungle の持つ複数の木構造と名前を関連付けた Map をreadTVarで取得する. | |
49 | 177 ルートノードの管理のための STM の変数をもった Tree を作成し, Jungle の Map に insert する. |
178 そして最後に writeTVar を用いて STM を更新する. | |
47 | 179 writeTVar は更新する先の変数と, 更新内容の2つを受け取る STM の関数である. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
180 |
49 | 181 実際にcreateJungleとcreateTreeを利用する時はソースコード\ref{src:createdatabase}のように記述する. |
34 | 182 |
49 | 183 \begin{lstlisting}[label=src:createdatabase,caption=データベースと木の作成] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
184 main = do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
185 jungle <- createJungle |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
186 createTree jungle "name of new tree here" |
10 | 187 \end{lstlisting} |
188 | |
189 \subsubsection{ルートノード} | |
47 | 190 非破壊的木構造データベース Jungle では, 木の最新の状態を更新・参照するのにルートノードを使う. |
191 ルートノードは, 最新の木構造の根がどれかの情報を保持している(図\ref{fig:getrootnode}). | |
23 | 192 |
193 \begin{figure}[!htbp] | |
194 \begin{center} | |
195 \includegraphics[scale=0.7]{./images/get_root_node.pdf} | |
196 \end{center} | |
197 \caption{ルートノード} | |
198 \label{fig:getrootnode} | |
199 \end{figure} | |
200 | |
47 | 201 ルートノードに関する関数を説明する. |
202 getRootNode は, 最新のルートノードを取得できる. | |
203 データベースと木の名前を渡すことで利用できる. | |
204 例えば, 図\ref{fig:getrootnode}の状態の時は, B というルートノードが取得できる. | |
10 | 205 |
49 | 206 |
60 | 207 getRootNode 関数の定義を示す(ソースコード\ref{src:getrootnode}). |
49 | 208 |
209 \begin{lstlisting}[label=src:getrootnode, caption=最新のルートノードの取得] | |
34 | 210 getRootNode :: Jungle -> String -> IO Node |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
211 getRootNode (Jungle tmap) tree_name = atomically $ do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
212 map <- readTVar tmap |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
213 readTVar (root_node map) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
214 where |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
215 root_node map = case lookup tree_name map of |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
216 Just x -> rootNode x |
10 | 217 \end{lstlisting} |
218 | |
62 | 219 まず, readTVarでJungleが持つmapを参照する. |
220 Haskell では where キーワードを用いて計算の中間結果に名前をつけたり, 関数内で使える関数を定義できる. | |
221 今回は, root\_node という map を受け取る関数をを内部で定義している. | |
222 root\_node map では, Jungle が持つ Map をみて取得しようとしている名前の木構造があるかどうか調べている. | |
223 木構造があった場合, rootNodeというTreeに定義されているレコード構文のアクセサ関数を使って, (TVar Node)を取得する. | |
224 最後に, (TVar Node)に対して, readTVarを行うことで最新のルートノードが取得できる. | |
225 | |
47 | 226 木構造を編集する関数は全て Node を受け取って Node を返す. |
62 | 227 その返ってきた Node を新しいルートノードとして登録することで, 木構造の最新のルートノードが更新される. |
228 updateRootNode は, データベースと木の名前, 新しいルートノードの 3 つを渡す. | |
47 | 229 updateRootNodeをした後は, getRootNodeで取得できるルートノードが更新された状態になっている. |
10 | 230 |
60 | 231 updateRootNode 関数の定義を示す(ソースコード\ref{src:updaterootnode}). |
49 | 232 getRootNodeと同じように, Treeの(TVar Node)を取得し, 最後にwriteTVarを用いて更新している. |
233 | |
62 | 234 \newpage |
49 | 235 \begin{lstlisting}[label=src:updaterootnode, caption=ルートノードの更新] |
34 | 236 updateRootNode :: Jungle -> String -> Node -> IO () |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
237 updateRootNode (Jungle tmap) tree_name node = |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
238 atomically $ do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
239 map <- readTVar tmap |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
240 writeTVar (root_node map) node |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
241 where |
41 | 242 root_node map = case lookup tree_name map of |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
243 Just x -> rootNode x |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
244 \end{lstlisting} |
34 | 245 |
47 | 246 updateRootNodeWithは, ノードを更新する関数とデータベース, 木の名前を渡して利用する. |
247 ノードを更新する関数とは, ノードを受け取ってノードを返す関数である. (Node $->$ Node) がそれにあたる. | |
49 | 248 このupdateRootNodeWithを利用することで, getRootNodeをした後に編集しupdateRootNodeを行う一連の操作が分断されずに行われることが保証される. |
60 | 249 |
250 updateRootNodeWith 関数の定義を示す(ソースコード\ref{src:updaterootnodewith}). | |
49 | 251 updateRootNodeWithでは, 一連の操作を分断せずに行うためにreadTVarからwriteTVarまで同じ STM モナド内で行っている. |
62 | 252 atomicallyに関数にdo構文で 1 つに繋げたSTMモナドを渡すことで, このブロックがトランザクションとして実行される. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
253 |
49 | 254 \begin{lstlisting}[label=src:updaterootnodewith, caption=ルートノードの更新] |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
255 updateRootNodeWith :: (Node -> Node) -> Jungle -> String -> IO () |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
256 updateRootNodeWith f (Jungle tmap) tree_name = |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
257 atomically $ do |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
258 map <- readTVar tmap |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
259 n <- readTVar (root_node map) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
260 writeTVar (root_node map) (f n) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
261 where |
41 | 262 root_node map = case lookup tree_name map of |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
263 Just x -> rootNode x |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
264 \end{lstlisting} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
265 |
47 | 266 並列データベース Jungle で他のスレッドと状態を共有する操作は, |
267 createJungle, createTree, getRootNode, updateRootNode, updateRootNodeWith | |
268 で全てである. | |
269 並列データベース Jungle では, なるべく状態を共有しないようにすることで並列実行時の性能の向上を実現する. | |
49 | 270 ソフトウェアトランザクショナルメモリは書き込み時に他から変更があった場合にやり直しという操作はあるものの, 読み込みに関してはノンブロッキングで高速に読み込める. |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
271 |
60 | 272 \clearpage |
273 \section{Node} | |
47 | 274 Node は木構造を表現するデータ構造である. |
275 再帰的に定義されている. | |
276 各ノードは children として子ノードを複数持つことができる(図\ref{fig:node_components}). | |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
277 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
278 \begin{figure}[!htbp] |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
279 \begin{center} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
280 \includegraphics[width=110mm]{./images/node_component.pdf} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
281 \end{center} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
282 \caption{Nodeの構成要素} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
283 \label{fig:node_components} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
284 \end{figure} |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
285 |
47 | 286 children および attributes も Data.Map を用いて定義されている(ソースコード \ref{src:node}). |
40
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
287 |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
288 \begin{lstlisting}[label=src:node, caption=Nodeのデータ型の定義] |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
289 data Node = Node |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
290 { children :: (Map Int Node) |
bd30d93097da
describe Jungle and Tree
Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp>
parents:
35
diff
changeset
|
291 , attributes :: (Map String ByteString) } |
10 | 292 \end{lstlisting} |
293 | |
294 \subsubsection{木の編集} | |
47 | 295 木の編集には, Node を使う. |
296 木の編集に用いる関数は全て Node を受け取って Node を返す. | |
297 非破壊的木構造を利用しているため, getRootNode などで取得してきた Node は他のスレッドと干渉することなく自由に参照, 編集できる. | |
298 これらの編集のための関数は, 編集後updateRootNodeするか, ひとつの関数にまとめてupdateRootNodeWithをすることで木構造に反映させることができる. | |
10 | 299 |
49 | 300 編集対象のノードを指定するには, NodePath を利用する(図\ref{fig:nodepath}). |
47 | 301 NodePath は, ルートノードからスタートし, ノードの子どもの場所を次々に指定したものである. |
302 Haskell の基本データ構造であるリストを利用している. | |
10 | 303 |
304 \begin{figure}[!htbp] | |
305 \begin{center} | |
306 \includegraphics[width=100mm]{./images/nodepath.pdf} | |
307 \end{center} | |
308 \caption{NodePath} | |
309 \label{fig:nodepath} | |
310 \end{figure} | |
311 | |
47 | 312 木の編集を行う関数を紹介する. |
49 | 313 木の編集を行う関数の型の定義をソースコード\ref{src:editfunc_type}に示す. |
34 | 314 |
49 | 315 \begin{lstlisting}[label=src:editfunc_type, caption=木の編集を行う関数] |
41 | 316 addNewChildAt :: Node -> Path -> Node |
34 | 317 deleteChildAt :: Node -> Path -> Position -> Node |
41 | 318 putAttribute :: Node -> Path -> String -> ByteString -> Node |
319 deleteAttribute :: Node -> Path -> String -> Node | |
10 | 320 \end{lstlisting} |
321 | |
49 | 322 \paragraph*{addNewChildAt} |
323 ノードに新しい子を追加できる. | |
324 更新対象となる木構造の Node と, どこに追加するかの情報である NodePath を渡す必要がある. | |
325 子の場所は, インクリメントしながら自動的に指定される. | |
41 | 326 |
49 | 327 \paragraph*{deleteChildAt} |
328 ノードの子を削除できる. | |
329 更新対象となる木構造の Node と, どこのノードの子を削除するかという情報である NodePath, 削除したい子の場所を指定する Position を渡す必要がある. | |
41 | 330 |
49 | 331 \paragraph*{putAttribute} |
332 ノードに属性を追加できる. | |
333 更新対象となる木構造の Node と, どこに属性を追加するかの情報である NodePath を渡す必要がある. | |
334 属性はキーと値があり, キーは String, 値は ByteString である. | |
41 | 335 |
49 | 336 \paragraph*{deleteAttribute} |
337 ノードの属性を削除できる. | |
338 更新対象となる木構造の Node と, どこの属性を削除するかの情報である NodePath, 削除したい属性のキーである String を渡す必要がある. | |
41 | 339 |
47 | 340 これらの関数は, ほぼ同一の関数で定義できる. |
49 | 341 addNewChildAtを用いて説明する(ソースコード\ref{src:addNewChildAt}). |
23 | 342 |
60 | 343 \newpage |
49 | 344 \begin{lstlisting}[label=src:addNewChildAt, caption=木の編集を行う関数] |
41 | 345 addNewChildAt :: Node -> Path -> Node |
346 addNewChildAt parent [] = addChildAt parent emptyNode | |
347 addNewChildAt parent (x:xs) = addChild parent x $ addNewChildAt x_node xs | |
348 where | |
349 map = children parent | |
350 x_node = case lookup x map of | |
351 Just x -> x | |
34 | 352 |
41 | 353 addChild :: Node -> Position -> Node -> Node |
354 addChild node pos child = Node new_child attr | |
355 where | |
356 map = children node | |
357 new_child = insert pos child map | |
358 attr = attributes node | |
359 | |
360 addChildAt :: Node -> Node -> Node | |
361 addChildAt node child = Node new_child attr | |
362 where | |
363 map = children node | |
364 pos = (size map) + 1 | |
365 new_child = insert pos child map | |
366 attr = attributes node | |
10 | 367 \end{lstlisting} |
368 | |
47 | 369 非破壊的木構造の編集は再帰で定義できる. |
370 左結合となる\$を使い, 対象のノードに到達するまで, addChildを繰り返す. | |
62 | 371 addChildは, 指定したノードのPositionに子を追加する. 引数として子となるノードが必要であり, 下の階層から上に作られていく. |
23 | 372 |
47 | 373 addNewChildAt, deleteChildAt, putAttribute, deleteAttributeといった, |
374 非破壊的木構造の編集は, 対象のノードに対する操作以外は全て同じである. | |
375 Pathのリストが空になる, すなわち対象のノードに到達した時の操作だけが異なる. | |
376 新しい子を追加するのが addNewChildAt, 指定されたポジションの子を削除するのが deleteChildAt, | |
377 指定されたキーと値を追加するのが putAttribute, 指定されたキーの値を削除するのが deleteAttributeである. | |
10 | 378 |
49 | 379 \subsubsection{木の参照} |
380 木の参照にも参照対象となる木構造の Node を用いる. | |
65 | 381 木構造の参照関数の定義をソースコード\ref{src:reffunc}に示す. |
10 | 382 |
65 | 383 \begin{lstlisting}[label=src:reffunc, caption=木構造の参照関数] |
49 | 384 getNode :: Node -> Path -> Node |
385 getNode node [] = node | |
386 getNode node (x:xs) = getNode child xs | |
387 where | |
388 map = children node | |
389 child = case M.lookup x map of | |
390 Just x -> x | |
34 | 391 getAttributes :: Node -> Path -> String -> Maybe ByteString |
41 | 392 getAttributes node path key = lookup key map |
393 where | |
394 target = getNode node path | |
395 map = attributes target | |
34 | 396 |
41 | 397 getChildren :: Node -> Path -> [Node] |
398 getChildren node path = elems map | |
399 where | |
400 target = getNode node path | |
401 map = children target | |
402 | |
403 assocsChildren :: Node -> Path -> [(Int, Node)] | |
404 assocsChildren node path = assocs map | |
405 where | |
406 target = getNode node path | |
407 map = children target | |
2 | 408 |
41 | 409 assocs :: Node -> Path -> [(String, ByteString)] |
410 assocs node path = assocs map | |
411 where | |
412 target = getNode node path | |
413 map = attributes target | |
23 | 414 |
41 | 415 numOfChild :: Node -> Path -> Int |
416 numOfChild node path = size map | |
417 where | |
418 target = getNode node path | |
419 map = children target | |
34 | 420 |
41 | 421 currentChild :: Node -> Path -> Maybe Node |
422 currentChild node path = lookup pos map | |
423 where | |
424 target = getNode node path | |
425 map = children target | |
426 pos = size map | |
10 | 427 \end{lstlisting} |
428 | |
65 | 429 木構造の参照関数の基本的な流れは, getNode関数を使って参照したいPathのノードを取ってくることである. |
60 | 430 そのノードにはwhereキーワードを利用して, targetという名前をつけている. |
431 targetに対して, 子のMapや属性のMapを取得した後, lookup関数などを適用する. | |
432 elems, assocs, sizeなどはData.Mapの参照関数で, Jungle ではその関数をそのまま利用している. | |
23 | 433 |
65 | 434 木構造の参照関数の基本的な機能をまとめて説明する. |
34 | 435 |
49 | 436 \paragraph*{getAttributes} |
437 対象の Path に存在する属性を Key を用いて参照できる. | |
438 | |
439 \paragraph*{getChildren} | |
440 対象の Node が持つ全ての子を Node のリストとして返す. | |
47 | 441 あるNodeに存在する全ての子に対して, 参照を行いたい場合に利用する. |
23 | 442 |
49 | 443 \paragraph*{assocsChildren} |
444 対象の Node が持つ全ての子を Position とのタプルにし, そのタプルのリストを返す. | |
47 | 445 あるNodeに存在する全ての子に対して, 子のPositionを取得しながら参照を行いたい場合に利用する. |
34 | 446 |
49 | 447 \paragraph*{assocsAttribute} |
448 対象の Node が持つ全ての属性を, キーと値のペアとし, そのペアのリストを返す. | |
47 | 449 あるNodeに存在する全ての属性に対して, 参照を行いたい場合に利用する. |
10 | 450 |
49 | 451 \paragraph*{numOfChild} |
452 対象の Node が持つ子どもの数を取得できる. | |
10 | 453 |
49 | 454 \paragraph*{currentChild} |
455 対象の Node が持つ最新の子を取得できる. | |
23 | 456 |