Mercurial > hg > Papers > 2020 > anatofuz-sigos
annotate paper/anatofuz-sigos.tex @ 45:4cecdfd6b237
update
author | anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Thu, 07 May 2020 15:40:54 +0900 |
parents | 698ba8f724d3 |
children | 667ae17b169e |
rev | line source |
---|---|
10 | 1 %% |
2 %% 研究報告用スイッチ | |
3 %% [techrep] | |
4 %% | |
5 %% 欧文表記無しのスイッチ(etitle,eabstractは任意) | |
6 %% [noauthor] | |
7 %% | |
8 | |
9 %\documentclass[submit,techrep]{ipsj} | |
10 \documentclass[submit,techrep,noauthor]{ipsj} | |
11 | |
12 | |
13 | |
23 | 14 \usepackage[dvips,dvipdfmx]{graphicx} |
10 | 15 \usepackage{latexsym} |
14 | 16 \usepackage{listings} |
17 \lstset{ | |
18 language=C, | |
19 tabsize=2, | |
20 frame=single, | |
21 basicstyle={\tt\footnotesize}, % | |
22 identifierstyle={\footnotesize}, % | |
23 commentstyle={\footnotesize\itshape}, % | |
24 keywordstyle={\footnotesize\ttfamily}, % | |
25 ndkeywordstyle={\footnotesize\ttfamily}, % | |
26 stringstyle={\footnotesize\ttfamily}, | |
27 breaklines=true, | |
28 captionpos=b, | |
29 columns=[l]{fullflexible}, % | |
30 xrightmargin=0zw, % | |
31 xleftmargin=1zw, % | |
32 aboveskip=1zw, | |
33 numberstyle={\scriptsize}, % | |
34 stepnumber=1, | |
35 numbersep=0.5zw, % | |
36 lineskip=-0.5ex, | |
37 } | |
38 \usepackage{caption} | |
39 | |
10 | 40 |
41 \def\Underline{\setbox0\hbox\bgroup\let\\\endUnderline} | |
42 \def\endUnderline{\vphantom{y}\egroup\smash{\underline{\box0}}\\} | |
43 \def\|{\verb|} | |
44 % | |
45 | |
46 %\setcounter{巻数}{59}%vol59=2018 | |
47 %\setcounter{号数}{10} | |
48 %\setcounter{page}{1} | |
14 | 49 \renewcommand{\lstlistingname}{Code} |
10 | 50 |
51 \begin{document} | |
52 | |
53 | |
54 \title{xv6の構成要素の継続の分析} | |
55 | |
56 %\etitle{How to Prepare Your Paper for IPSJ SIG Technical Report \\ (version 2018/10/29)} | |
57 | |
58 \affiliate{KIE}{琉球大学大学院理工学研究科情報工学専攻} | |
59 \affiliate{IE}{琉球大学工学部工学科知能情報コース} | |
60 | |
61 | |
62 \author{清水 隆博}{Shimizu Takahiro}{KIE}[anatofuz@cr.ie.u-ryukyu.ac.jp] | |
63 \author{河野 真治}{Shinji Kono}{IE}[kono@ie.u-ryukyu.ac.jp] | |
64 | |
65 \begin{abstract} | |
66 OS自体そのものは高い信頼性が求められるが、 OSを構成するすべての処理をテストするのは困難である。 | |
67 テストを利用して信頼性を高めるのではなく、 OSの状態を状態遷移を基本としたモデルに変換し形式手法を用いて信頼性を高めたい。 | |
68 | |
69 状態遷移単位での記述に適した言語であるCbCを用いて、小さなunixであるxv6 kernelの書き換えを行っている。 | |
70 このためには現状のxv6 kernelの処理がどのような状態遷移を行うのかを分析し、継続ベースでのプログラミングに変換していく必要がある。 | |
71 本稿ではxv6kernelの構成要素の一部に着目し、状態遷移系の分析と状態遷移系を元に継続ベースでxv6の再実装を行う。 | |
72 \end{abstract} | |
73 | |
74 | |
75 \maketitle | |
76 | |
77 \section{OSの信頼性} | |
78 様々なアプリケーションはOSの上で動作するのが当たり前になってきた。 | |
79 アプリケーションの信頼性を向上させるのはもとより、 土台となるOS自体の信頼性は高く保証されていなければならない。 | |
80 OSそのものも巨大なプログラムであるため、 テストコードを用いた方法で信頼性を確保する事が可能である。 | |
45 | 81 しかし並列並行処理などに起因するバグや、 そもそもOSを構成する処理が巨大であることから、 テストで完全にバグを発見するのは困難である。 |
10 | 82 テスト以外の方法でOSの信頼性を高めたい。 |
83 | |
84 数学的な背景に基づく形式手法を用いてOSの信頼性を向上させることを検討する。 | |
85 OSを構成する要素をモデル検査してデッドロックなどを検知する方法や、 定理証明支援系を利用した証明ベースでの信頼性の確保などの手法が考えられる。 | |
86 形式手法で信頼性を確保するには、 まずOSの処理を証明などがしやすい形に変換して実装し直す必要がある。 | |
87 これに適した形として、 状態遷移モデルが挙げられる。 | |
88 OSの内部処理の状態を明確にし、 状態遷移モデルに落とし込むことでモデル検査などを通して信頼性を向上させたい。 | |
22 | 89 既存のOSはそのままに処理を状態遷移モデルに落とし込む為には、 まず既存のOSの処理中の状態遷移を分析し、仕様記述言語などによる再実装が必要となる。 |
90 しかし仕様記述言語や定理証明支援系では、 実際に動くOSと検証用の実装が別の物となってしまうために、 C言語などでの実装の段階で発生するバグを取り除くことができない。 | |
10 | 91 実装のソースコードと検証用のソースコードは近いセマンティクスでプログラミングする必要がある。 |
92 | |
21 | 93 さらに本来行いたい処理の他に、メモリ管理やスレッド、 CPUなどの資源管理も行う必要がある。 |
94 本来計算機で実行したい計算に必要な計算をメタ計算と呼び、 意図して行いたい処理をノーマルレベルの計算と呼ぶ。 | |
95 ノーマルレベル上での問題点をメタ計算上で発見し信頼性を向上させたい。 | |
96 プログラマからはノーマルレベルの計算のみ実装するが、整合性の確認や拡張を行う際にノーマルレベルと同様の記述力でメタ計算も実装できる必要がある。 | |
97 | |
98 ノーマルレベルの計算とメタ計算の両方の実装に適した言語としてContinuation Based C(CbC)がある。 | |
12 | 99 CbCはCと互換性のあるCの下位言語であり、 状態遷移をベースとした記述に適したプログラミング言語である。 |
100 Cとの互換性のために、 CbCのプログラムをコンパイルすることで動作可能なバイナリに変換が可能である。 | |
15 | 101 またCbCの基本文法は簡潔であるため、 Agdaなどの定理証明支援系との相互変換や、 CbC自体でのモデル検査が可能であると考えられる。 |
12 | 102 すなわちCbCを用いて状態遷移を基本とした単位でプログラミングをすると、 形式手法で証明が可能かつ実際に動作するコードを記述できる。 |
103 | |
104 現在小さなunixであるxv6 kernelをCbCを用いて再実装している。 | |
105 再実装の為には、 既存のxv6 kernelの処理の状態遷移を分析し、継続を用いたプログラムに変換していく必要がある。 | |
106 本論文ではこの書き換えに伴って得られたxv6 kernelの継続を分析し、 現在のCbCによる書き換えについて述べる。 | |
107 | |
10 | 108 |
13 | 109 |
110 \section{Continuation Based C} | |
111 | |
112 Continuation Based C(CbC)とはC言語の下位言語であり、 関数呼び出しではなく継続を導入したプログラミング言語である。 | |
17 | 113 CbCでは通常の関数呼び出しの他に、 関数呼び出し時のスタックの操作を行わず、次のコードブロックに\texttt{jmp}命令で移動する継続が導入されている。 |
13 | 114 この継続はSchemeなどの環境を持つ継続とは異なり、 スタックを持たず環境を保存しない継続である為に軽量である事から軽量継続と呼べる。 |
17 | 115 またCbCではこの軽量継続を用いた再帰呼び出しを利用することで\texttt{for}文などのループ文を廃し、 関数型プログラミングに近いスタイルでプログラミングが可能となる。 |
13 | 116 現在CbCはGCC及びLLVM/clang上にそれぞれ実装されている。 |
117 | |
14 | 118 |
17 | 119 CbCでは関数の代わりにCodeGearという単位でプログラミングを行う。 |
120 CodeGearは通常のCの関数宣言の返り値の型の代わりに\texttt{\_\_code}で宣言を行う。 | |
28 | 121 各CodeGearはDataGearと呼ばれるデータの単位で入力を受け取り、 その結果を別のDataGearに書き込む。 |
122 入力のDataGearをInputDataGearと呼び、 出力のDataGearをOutputDataGearと呼ぶ。 | |
123 CodeGearがアクセスできるDataGearは、 InputDataGearとOutputDataGearに限定される。 | |
124 これらの関係図を図\ref{fig:cgdg}に示す。 | |
125 | |
126 \begin{figure}[tb] | |
127 \begin{center} | |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
128 \includegraphics[width=80mm]{fig/cgdg.pdf} |
28 | 129 \end{center} |
130 \caption{CodeGearと入出力の関係図} | |
131 \label{fig:cgdg} | |
132 \end{figure} | |
17 | 133 |
15 | 134 CbCで階乗を求める例題をCode \ref{src:cbc_example}に示す。 |
17 | 135 例題ではCodeGearとして\texttt{factorial}を宣言している。 |
18 | 136 \texttt{factorial}はCodeGearの引数として\texttt{struct F}型の変数\texttt{arg}を受け取り、\texttt{arg}のメンバー変数によって\texttt{factorial}の再帰呼び出しを行う。 |
17 | 137 CodeGearの呼び出しは\texttt{goto}文によって行われる。 |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
138 この例題を状態遷移図にしたものを図\ref{fig:factorial_cbc}に示す。 |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
139 図中の四角がDataGear、 円がCodeGearに対応する。 |
14 | 140 |
141 | |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
142 \begin{lstlisting}[frame=lrbt,label=src:cbc_example,caption={CbCで階乗を求める例題}] |
15 | 143 __code factorial(struct F arg) { |
144 if (arg.n<0) { | |
145 exit(1); | |
146 } | |
147 if (arg.n==0) { | |
148 goto arg.next(arg); | |
149 } else { | |
150 arg.r *= arg.n; | |
151 arg.n--; | |
152 goto factorial(arg); | |
14 | 153 } |
154 } | |
15 | 155 \end{lstlisting} |
14 | 156 |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
157 \begin{figure}[tb] |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
158 \begin{center} |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
159 \includegraphics[width=80mm]{fig/factorial_cbc.pdf} |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
160 \end{center} |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
161 \caption{CbCで階乗を求める例題の状態遷移} |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
162 \label{fig:factorial_cbc} |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
163 \end{figure} |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
164 |
17 | 165 CodeGearは関数呼び出し時のスタックを持たない為、一度あるCodeGearに遷移してしまうと元の処理に戻ってくることができない。 |
166 しかしCodeGearを呼び出す直前のスタックは保存されるため、 部分的にCbCを適用する場合はCodeGearを呼び出す\texttt{void}型などの関数を経由することで呼び出しが可能となる。 | |
167 | |
168 この他にCbCからCへ復帰する為のAPIとして、 環境付きgotoという機能がある。 | |
18 | 169 これはGCCでは内部コードを生成、 LLVM/clangでは\texttt{setjmp}と\texttt{longjmp}を使うことでCodeGearの次の継続対象として呼び出し元の関数を設定することが可能となる。 |
17 | 170 したがってプログラマから見ると、通常のCの関数呼び出しの返り値をCodeGearから取得する事が可能となる。 |
171 | |
20 | 172 \section{CbCを用いたOSの実装} |
173 | |
174 軽量継続を持つCbCを利用して、 証明可能なOSを実装したい。 | |
175 その為には証明に使用される定理証明支援系や、 モデル検査機での表現に適した状態遷移単位での記述が求められる。 | |
176 CbCで使用するCodeGearは、 状態遷移モデルにおける状態そのものとして捉えることが可能である。 | |
22 | 177 CodeGearを元にプログラミングをするにつれて、 CodeGearの入出力のDataも重要であることが解ってきた。 |
178 CodeGearとその入出力であるDataGearを基本としたOSとして、 GearsOSの設計を行っている。 | |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
179 現在のGearsOSは並列フレームワークとして実装されており、 実用的なOSのプロトタイプ実装として既存のOS上への実装を目指している。 |
22 | 180 |
181 GearsOSでは、 CodeGearとDataGearを元にプログラミングを行う。 | |
21 | 182 遷移する各CodeGearの実行に必要なデータの整合性の確認などのメタ計算は、 MetaCodeGearと呼ばれる各CodeGearごと実装されたCodeGearで計算を行う。 |
22 | 183 このMetaCodeGearの中で参照されるDataGearをMetaDataGearと呼ぶ。 |
28 | 184 また、 対象のCodeGearの直前で実行されるMetaCodeGearをStubCodeGearと呼ぶ。 |
36 | 185 MetaCodeGearやMetaDataGearは、プログラマが直接実装することはなく、 現在はPerlスクリプトによってGearsOSのビルド時に生成される。 |
26 | 186 CodeGearから別のCodeGearに遷移する際のDataGearなどの関係性を、図\ref{meta-cg-dg}に示す。 |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
187 |
24 | 188 \begin{figure}[tb] |
189 \begin{center} | |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
190 \includegraphics[width=80mm]{./fig/meta-cg-dg.pdf} |
24 | 191 \end{center} |
192 \caption{CodeGearとMetaCodeGear} | |
193 \label{meta-cg-dg} | |
194 \end{figure} | |
26 | 195 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
196 通常のコード中では入力のDataGearを受け取りCodeGearを実行、 結果をDataGearに書き込んだ上で別のCodeGearに継続する様に見える。 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
197 この流れを図\ref{meta-cg-dg}の上段に示す。 |
26 | 198 しかし実際はCodeGearの実行の前後に実行されるMetaCodeGearや入出力のDataGearを保存場所から取り出すMetaDataGearなどのメタ計算が加わる。 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
199 これは図\ref{meta-cg-dg}の下段に対応する。 |
26 | 200 |
201 遷移先のCodeGearとMetaCodeGearの紐付けや、 計算に必要なDataGearを保存や管理を行うMetaDataGearとしてcontextがある。 | |
202 contextは処理に必要なCodeGearの番号とMetaCodeGearの対応表や、 DataGearの格納場所を持つ。 | |
28 | 203 計算に必要なデータ構造と処理を持つデータ構造であることから、 contextは従来のOSのプロセスに相当するものと言える。 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
204 cotnextと各データ構造の関わりを図\ref{fig:context_ref}に示す。 |
28 | 205 \begin{figure}[tb] |
206 \begin{center} | |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
207 \includegraphics[width=80mm]{fig/Context_ref.pdf} |
28 | 208 \end{center} |
209 \caption{Contextと各データの関係図} | |
210 \label{fig:context_ref} | |
211 \end{figure} | |
18 | 212 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
213 コード上では別のCodeGearに直接遷移している様に見えるが、 実際はcontext内の遷移先のCodeGearに対応するスロットから、対応するMetaCodeGearに遷移する。 |
36 | 214 MetaCodeGear中で、次に実行するCodeGearで必要なDataGearをcontextから取り出し、 実際の計算が行われる。 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
215 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
216 |
22 | 217 \section{xv6 kernel} |
218 | |
219 xv6とはマサチューセッツ工科大学でv6 OSを元に開発された教育用のUNIX OSである。 | |
220 xv6はANSI Cで実装されており、 x86アーキテクチャ上で動作する。 | |
221 Raspberry Pi上での動作を目的としたARMアーキテクチャのバージョンも存在する。 | |
222 本論文では最終的にRaspberry Pi上での動作を目指しているために、 ARMアーキテクチャ上で動作するxv6を扱う。 | |
223 | |
224 xv6は小規模なOSだがファイルシステム、 プロセス、システムコールなどのUNIXの基本的な機能を持つ。 | |
225 またユーザー空間とカーネル空間が分離されており、 シェルやlsなどのユーザーコマンドも存在する。 | |
226 | |
227 本論文ではxv6のファイルシステム関連の内部処理と、システムコール実行時に実行される処理について分析を行う。 | |
228 xv6 kernelのファイルシステムは階層構造で表現されており、 最も低レベルなものにディスク階層、 抽象度が最も高いレベルのものにファイル記述子がある。 | |
229 | |
36 | 230 本論文ではxv6の継続の分析をシステムコール部分とファイルシステム、 仮想メモリなどのOSの根幹部分でそれぞれ行った。 |
32 | 231 |
18 | 232 |
30 | 233 \section{xv6のシステムコールの継続の分析} |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
234 xv6の処理を継続を中心とした記述で再実装を行う。 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
235 この際に、 xv6のどの処理に着目するかによって継続の実装が異なっていくことが実装につれてわかった。 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
236 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
237 まずxv6の\texttt{read} システムコールに着目し、 システムコール内部でどのような状態を遷移するかを分析した。 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
238 分析結果をCbCのCodeGearに変換し、 状態遷移図におこしたものを図\ref{fig:cbc_readsyscall}に示す。 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
239 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
240 \begin{figure}[tb] |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
241 \begin{center} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
242 \includegraphics[width=80mm]{fig/readsyscall_state.pdf} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
243 \end{center} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
244 \caption{readシステムコールの状態遷移} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
245 \label{fig:cbc_readsyscall} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
246 \end{figure} |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
247 |
30 | 248 CbCで再実装した\texttt{read}システムコールは、 xv6の\texttt{read}システムコールのディスパッチ部分から、 \texttt{cbc\_read}CodeGearに\texttt{goto}文で軽量継続される。 |
249 継続後はreadする対象によって\texttt{cbc\_readi}や、 \texttt{cbc\_consoleread}などに状態が変化していく。 | |
32 | 250 各CodeGearの遷移時にはDataGearがやり取りされる。 |
251 DataGearはxv6のプロセス構造体に埋め込まれたcontextを経由してCodeGearに渡される。 | |
252 | |
30 | 253 この実装の利点として、 CodeGearの命名と状態が対応しており、 状態遷移図などに落としても自然言語で説明が可能となる点が挙げられる。 |
254 しかし実際には\texttt{cbc\_readi}の状態はさらに複数のCodeGearに分離しており、 実際に\texttt{read}システムコールを実装するCodeGearの数は図の状態より多い。 | |
255 この事から、 複数のCodeGearを1つにまとめた上で見た状態と、 各CodeGearそれぞれの状態の2種類の状態があるといえる。 | |
256 | |
34 | 257 複数のCodeGearをまとめた状態は、 抽象化したAPIの操作時におけるアルゴリズム上の問題が無いかの確認として使用出来る。 |
30 | 258 対して各CodeGearそれぞれはモデル検査や、 特定の関数の中の処理が適しているかどうかの検査として見ることが出来ると考えられる。 |
259 | |
32 | 260 この事からGearsOSでは、 各CodeGearのモジュール化の仕組みであるInterface機能を導入している。 |
261 Interfaceの導入によってCodeGearを定義することで状態数を増やしても、 抽象化されたAPIを利用することで細部の状態まで意識する必要が無くなった。 | |
33 | 262 xv6の処理をCbCで再実装する際には、 対象の継続のAPIをまず決定しモジュール化を図る必要がある。 |
30 | 263 |
264 \section{xv6のシステムコール以外の継続の分析} | |
33 | 265 xv6はシステムコール以外に、 ファイルシステムの操作やページテーブルの管理などの処理も存在している。 |
266 これらはOSの立ち上げ時やシステムコールの中で、ファイルシステムの操作に対応した関数や構造体などのAPIを通して操作される。 | |
35 | 267 システムコールの一連の流れに着目するのではなく、 特定の対象のAPIに着目して継続の分析を検討した。 |
268 | |
39 | 269 xv6のファイルシステムに関する関数などのAPIは主に\texttt{fs.c}中に記述されている。 |
37 | 270 Code\ref{src:fs_interface}に示す様に、 \texttt{fs.c}中に定義されているAPIを抜き出し、 CbCのInterfaceとして定義した。 |
36 | 271 \texttt{\_\_code}から始まるCodeGearの名前が、 それぞれ抽象化されたCodeGearの集合の最初の継続となる。 |
35 | 272 |
273 | |
274 \begin{lstlisting}[frame=lrbt,label=src:fs_interface,caption={ファイルシステム操作のAPIの一部}] | |
275 typedef struct fs<Type,Impl> { | |
276 __code readsb(Impl* fs, uint dev, struct superblock* sb, __code next(...)); | |
277 __code iinit(Impl* fs, __code next(...)); | |
278 __code ialloc(Impl* fs, uint dev, short type, __code next(...)); | |
279 __code iupdate(Impl* fs, struct inode* ip, __code next(...)); | |
280 __code idup(Impl* fs, struct inode* ip, __code next(...)); | |
281 __code ilock(Impl* fs, struct inode* ip, __code next(...)); | |
282 __code iunlock(Impl* fs, struct inode* ip, __code next(...)); | |
283 __code iput(Impl* fs, struct inode* ip, __code next(...)); | |
284 .... | |
285 } fs; | |
286 \end{lstlisting} | |
287 | |
37 | 288 Code\ref{src:fs_interface}内の \texttt{readsb}などは\texttt{fs.c}内で定義されているCの関数名と対応している。 |
289 このCの関数を更に継続ごと分割するために、 関数内のif文などの分岐を持たない基本単位であるBasic Blockに着目した。 | |
30 | 290 |
15 | 291 CbCのCodeGearの粒度はCの関数とアセンブラの中間であるといえるので、 BasicBlockをCodeGearに置き換える事が可能である。 |
35 | 292 したがって特定の関数内の処理のBasicBlockを分析し、 BasicBlockに対応したCodeGearへ変換することが可能となる。 |
39 | 293 実際にBasicBlock単位で切り分ける前の処理と、切り分けたあとの処理の一部を示す。 |
294 例としてinodeのアロケーションを行うAPIでる\texttt{ialloc}の元のコードをCode\ref{src:ialloc_origin}に示す。 | |
295 | |
296 \begin{lstlisting}[frame=lrbt,label=src:ialloc_origin,caption={iallocの元のソースコード}] | |
297 struct inode* ialloc (uint dev, short type) | |
298 { | |
299 readsb(dev, &sb); | |
300 for (inum = 1; inum < sb.ninodes; inum++) { | |
301 bp = bread(dev, IBLOCK(inum)); | |
302 dip = (struct dinode*) bp->data + inum % IPB; | |
37 | 303 |
39 | 304 if (dip->type == 0) { // a free inode |
305 memset(dip, 0, sizeof(*dip)); | |
306 // omission | |
307 return iget(dev, inum); | |
308 } | |
309 brelse(bp); | |
310 } | |
311 panic("ialloc: no inodes"); | |
312 } | |
313 \end{lstlisting} | |
314 | |
315 \texttt{ialloc}はループ条件である \texttt{inum < sb.ninodes}が成立しなかった場合は\texttt{panic}へと状態が遷移する。 | |
316 この\texttt{for}文での状態遷移をCodeGearに変換したものをCode\ref{src:allocinode_loopcheck}に示す。 | |
317 | |
318 | |
319 \begin{lstlisting}[frame=lrbt,label=src:allocinode_loopcheck,caption={ループ条件を確認するCodeGear}] | |
320 __code allocinode_loopcheck(struct fs_impl* fs_impl, uint inum, uint dev, struct superblock* sb, struct buf* bp, struct dinode* dip, __code next(...)){ | |
321 if( inum < sb->ninodes){ | |
322 goto allocinode_loop(fs_impl, inum, dev, type, sb, bp, dip, next(...)); | |
323 } | |
324 char* msg = "failed allocinode..."; | |
325 struct Err* err = createKernelError(&proc->cbc_context); | |
326 goto err->panic(msg); | |
327 } | |
328 \end{lstlisting} | |
15 | 329 |
40 | 330 Code\ref{src:allocinode_loopcheck}ではループ条件の成立を\texttt{if}文で確認し、ループ処理に移行する場合は \texttt{allocinode\_loop}へ遷移する。 |
331 ループ条件が満たされなかった場合は、 コンテキストから\texttt{panic}に関するCodeGearの集合を取り出し、 集合中の\texttt{panic} CodeGearへと遷移する。 | |
332 オリジナルの処理では、 ループ中に\texttt{dip->type == 0}が満たされた場合は関数から\texttt{return}文により関数から復帰する。 | |
333 CodeGearではCode\ref{src:alloc_loop}内で、 状態が分けられる。 | |
334 この先の継続は、 復帰用のCodeGearかループの先頭である\texttt{allocinode\_loopcheck}に再帰的に遷移するかになる。 | |
335 | |
336 \begin{lstlisting}[frame=lrbt,label=src:alloc_loop,caption={ループ中に復帰するかどうかの確認をするCodeGear}] | |
337 __code allocinode_loop(struct fs_impl* fs_impl, uint inum, uint dev, short type, struct superblock* sb, struct buf* bp, struct dinode* dip, __code next(...)){ | |
338 bp = bread(dev, IBLOCK(inum)); | |
339 dip = (struct dinode*) bp->data + inum % IPB; | |
340 if(dip->type = 0){ | |
341 goto allocinode_loopexit(fs_impl, inum, dev, sb, bp, dip, next(...)); | |
342 } | |
343 | |
344 brelse(bp); | |
345 inum++; | |
346 goto allocinode_loopcheck(fs_impl, inum, dev, type, sb, bp, dip, next(...)); | |
347 } | |
348 \end{lstlisting} | |
349 | |
350 この継続の分析方法の利点として、 既存のコードのBasic Block単位でCodeGearに変換可能であるため機械的にCodeGearへの変更が可能となる。 | |
351 既存の関数上のアルゴリズムや処理に殆ど変更がなく変更可能であるために、 CodeGearで細分化して表現することは容易となる。 | |
41 | 352 |
353 現在は従来のxv6の関数呼び出しを元にしたAPIの中でCodeGearに分割している。 | |
354 このために既存のAPI内の処理の細分化は可能とはなったが、 APIそのものをCodeGearを用いた継続に適した形には表現できていない。 | |
355 APIの内部のCodeGearはあくまでBasic Block単位に基づいているために、 状態遷移図で表現した際に自然言語で表現できないCodeGearも存在してしまう。 | |
356 | |
357 さらに、 \texttt{for}ループをCodeGearに分割することを考えるとループ中にループのindexを利用している場合は、 そのindexも次の継続に渡さなければならない。 | |
358 このためindexを使用していないCodeGearでも継続の引数としてindexを受け取り、 実際にindexを利用するCodeGearに伝搬させる必要がある。 | |
42 | 359 これらの問題を解決する為には、 APIを分割したCodeGearそれぞれのDataGearに型を与え、 どの継続でDataGearの意味が変わるかを追求する必要がある。 |
43 | 360 APIを分割して作成したCodeGearのDataGearは、 現在各APIに対応した1つの巨大な構造体に隠蔽されている。 |
42 | 361 巨大な構造体で管理するのではなく、 構造体で次のCodeGearの状態に影響を与える要素を適宜組み合わせたDataGearを作る必要がある。 |
40 | 362 |
29
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
363 |
5dbe39f52406
add readsyscall_state
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
364 \section{CbCを用いた部分的なxv6の書き換え} |
28 | 365 |
366 CbCではCodeGear、 DataGearからなる単位を基本とし、 それぞれにメタなGearが付随する。 | |
367 また実行に必要なCodeGearとDataGearをまとめたcontextというMetaDataGearが存在する。 | |
368 この機能を元にxv6の書き換えを検討した。 | |
369 | |
370 xv6内でCbCの軽量継続に突入する際は、 元の処理関数に通常の方法では戻ってくることができず、部分的に書き換えていくのが困難である。 | |
371 今回は呼び出し関数に戻れるスタックフレームを操作したい為に、 ダミーの\texttt{void}関数を用意した。 | |
372 この関数内でCodeGearに\texttt{goto}文を用いて遷移することで、 CbCから帯域脱出した際に\texttt{void}関数の呼び出し元から処理を継続し、部分的にCbCに書き換えることが可能となった。 | |
373 Code\ref{src:dumy_function_cbc}では、 \texttt{userinit}関数へ戻るために、 \texttt{cbc\_init\_vmm\_dumy}を経由している。 | |
374 | |
375 \begin{lstlisting}[frame=lrbt,label=src:dumy_function_cbc,caption={部分的にCbCを適応する例}] | |
376 void cbc_init_vmm_dummy(struct Context* cbc_context, struct proc* p, pde_t* pgdir, char* init, uint sz) | |
377 { | |
378 struct vm* vm = createvm_impl(cbc_context); | |
379 goto vm->init_vmm(vm, pgdir, init, sz , vm->void_ret); | |
380 } | |
381 | |
382 void userinit(void) | |
383 { | |
384 // omission | |
385 | |
386 if((p->pgdir = kpt_alloc()) == NULL) { | |
387 panic("userinit: out of memory?"); | |
388 } | |
389 | |
390 cbc_init_vmm_dummy(&p->cbc_context, p, p->pgdir, _binary_initcode_start, (int)_binary_initcode_size); | |
391 | |
392 p->sz = PTE_SZ; | |
393 memset(p->tf, 0, sizeof(*p->tf)); | |
43 | 394 // omission |
395 } | |
28 | 396 \end{lstlisting} |
14 | 397 |
43 | 398 Code\ref{src:dumy_function_cbc}中で、 CodeGearへの遷移が行われる\texttt{goto vm->init\_vmm()}の\texttt{vm->void\_ret}は\texttt{init\_vmm}の次の継続のCodeGear名である。 |
399 この\texttt{vm->void\_ret}は\texttt{return}するのみのCodeGearであり、 void型関数と組み合わせることで呼び出し元へと復帰する事が可能となる。 | |
400 | |
31 | 401 |
402 \section{xv6の今後の再実装} | |
403 | |
404 xv6ではカーネルパニックの発生時や、 inodeのキャッシュなどをグローバル変数として利用している。 | |
405 グローバル変数を使用してしまうと、 CodeGearで定義した状態がDataGear以外のグローバル変数によって変更されてしまう。 | |
406 グローバル変数を極力使わず継続を中心とした実装を行いたい。 | |
407 | |
36 | 408 contextは現在プロセス構造体に埋め込まれており、 kernelそのものの状態を制御するためには各contextを管理する機能が必要であると考えられる。 |
43 | 409 contextを管理する方法として、 各context間でメッセージなどをやりとりする方法や、 cotnextを主軸にして割り込みなどの処理を再検討するものがある。 |
410 他にはkernelそのもののcontextを定義し、 kernel全体の状態とプロセスの状態をそれぞれ別のcotnextで処理をするというのも検討している。 | |
31 | 411 |
44 | 412 現状はxv6の全ての機能をまだCbCを用いて再実装をしていない。 |
413 ファイルシステムや仮想メモリにまつわる処理などはAPI単位では再実装しているが、 APIを呼び出す箇所はCの関数上で部分的に呼び出している。 | |
414 そのためにOSそのものを状態遷移単位で完全に書き直す必要が存在し、 そのためには全ての処理に対して状態を定義していく必要がある。 | |
415 xv6にはアセンブラで記述されている処理も複数存在するため、 CodeGrarの表現においてこのような処理の扱いも決定する必要がある。 | |
416 | |
417 またOS上でDataGearとCodeGearの位置づけを明確に定義する必要も存在する。 | |
418 現在は関数を分割した状態としてCodeGearを定義している。 | |
419 DataGearの依存関係やCodeGearの並列実行など、 プロセスベースで実装していた処理をCodeGearなどで意味がある形式にする必要がある。 | |
420 | |
421 またxv6にはユーザーコマンドも存在しているために、 ユーザーコマンド向けのCbCのAPIなども考慮したい。 | |
422 | |
43 | 423 \section{まとめ} |
424 | |
425 本稿ではxv6を継続を用いた単位での再実装を検討し、 実際にいくつかの処理を再実装した。 | |
44 | 426 現状はまだxv6の実装を利用した証明は行っていない。 |
427 今後はモデル検査などを行い、 OSの信頼性を向上させていきたい。 | |
43 | 428 それに伴って、 xv6自体にモデル検査機能の組み込みなども行っていく。 |
429 またAgdaなどの定理証明支援系で証明された処理から、 CbCのCodeGearに変換する処理系の実装なども検討する。 | |
44 | 430 |
431 | |
10 | 432 \nocite{*} |
433 \bibliographystyle{ipsjunsrt} | |
434 \bibliography{anatofuz-bib} | |
435 | |
436 | |
437 \end{document} |