Mercurial > hg > Papers > 2020 > anatofuz-sigos
annotate paper/anatofuz-sigos.md @ 25:87813fb8542c
add factorial_cbc.pdf
author | anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Mon, 04 May 2020 14:57:49 +0900 |
parents | d2a1d3d75484 |
children | dfcef5f101da |
rev | line source |
---|---|
10 | 1 # OSの信頼性 |
2 様々なアプリケーションはOSの上で動作するのが当たり前になってきた。 | |
3 アプリケーションの信頼性を向上させるのはもとより、 土台となるOS自体の信頼性は高く保証されていなければならない。 | |
4 OSそのものも巨大なプログラムであるため、 テストコードを用いた方法で信頼性を確保する事が可能である。 | |
5 しかし並列並行処理などに起因する動かしてみないと発見できないバグなどが存在するため、 テストで完全にバグを発見するのは困難である。 | |
6 また、OSを構成する処理も巨大であるため、 これら全てをテスト仕切るのも困難である。 | |
7 テスト以外の方法でOSの信頼性を高めたい。 | |
8 | |
9 数学的な背景に基づく形式手法を用いてOSの信頼性を向上させることを検討する。 | |
10 OSを構成する要素をモデル検査してデッドロックなどを検知する方法や、 定理証明支援系を利用した証明ベースでの信頼性の確保などの手法が考えられる。 | |
11 形式手法で信頼性を確保するには、 まずOSの処理を証明などがしやすい形に変換して実装し直す必要がある。 | |
12 これに適した形として、 状態遷移モデルが挙げられる。 | |
13 OSの内部処理の状態を明確にし、 状態遷移モデルに落とし込むことでモデル検査などを通して信頼性を向上させたい。 | |
22 | 14 既存のOSはそのままに処理を状態遷移モデルに落とし込む為には、 まず既存のOSの処理中の状態遷移を分析し、仕様記述言語などによる再実装が必要となる。 |
15 しかし仕様記述言語や定理証明支援系では、 実際に動くOSと検証用の実装が別の物となってしまうために、 C言語などでの実装の段階で発生するバグを取り除くことができない。 | |
10 | 16 実装のソースコードと検証用のソースコードは近いセマンティクスでプログラミングする必要がある。 |
17 | |
21 | 18 さらに本来行いたい処理の他に、メモリ管理やスレッド、 CPUなどの資源管理も行う必要がある。 |
19 本来計算機で実行したい計算に必要な計算をメタ計算と呼び、 意図して行いたい処理をノーマルレベルの計算と呼ぶ。 | |
20 ノーマルレベル上での問題点をメタ計算上で発見し信頼性を向上させたい。 | |
21 プログラマからはノーマルレベルの計算のみ実装するが、整合性の確認や拡張を行う際にノーマルレベルと同様の記述力でメタ計算も実装できる必要がある。 | |
22 | |
23 ノーマルレベルの計算とメタ計算の両方の実装に適した言語としてContinuation Based C(CbC)がある。 | |
11 | 24 CbCはCと互換性のあるCの下位言語であり、 状態遷移をベースとした記述に適したプログラミング言語である。 |
25 Cとの互換性のために、 CbCのプログラムをコンパイルすることで動作可能なバイナリに変換が可能である。 | |
15 | 26 またCbCの基本文法は簡潔であるため、 Agdaなどの定理証明支援系との相互変換や、 CbC自体でのモデル検査が可能であると考えられる。 |
12 | 27 すなわちCbCを用いて状態遷移を基本とした単位でプログラミングをすると、 形式手法で証明が可能かつ実際に動作するコードを記述できる。 |
10 | 28 |
11 | 29 現在小さなunixであるxv6 kernelをCbCを用いて再実装している。 |
30 再実装の為には、 既存のxv6 kernelの処理の状態遷移を分析し、継続を用いたプログラムに変換していく必要がある。 | |
31 本論文ではこの書き換えに伴って得られたxv6 kernelの継続を分析し、 現在のCbCによる書き換えについて述べる。 | |
32 | |
13 | 33 |
34 | |
35 # Continuation Based C | |
36 | |
37 Continuation Based C(CbC)とはC言語の下位言語であり、 関数呼び出しではなく継続を導入したプログラミング言語である。 | |
17 | 38 CbCでは通常の関数呼び出しの他に、 関数呼び出し時のスタックの操作を行わず、次のコードブロックに`jmp`命令で移動する継続が導入されている。 |
13 | 39 この継続はSchemeなどの環境を持つ継続とは異なり、 スタックを持たず環境を保存しない継続である為に軽量である事から軽量継続と呼べる。 |
17 | 40 またCbCではこの軽量継続を用いた再帰呼び出しを利用することで`for`文などのループ文を廃し、 関数型プログラミングに近いスタイルでプログラミングが可能となる。 |
13 | 41 現在CbCはGCC及びLLVM/clang上にそれぞれ実装されている。 |
14 | 42 |
43 | |
17 | 44 CbCでは関数の代わりにCodeGearという単位でプログラミングを行う。 |
45 CodeGearは通常のCの関数宣言の返り値の型の代わりに`__code`で宣言を行う。 | |
46 | |
15 | 47 CbCで階乗を求める例題をCode \ref{src:cbc_example}に示す。 |
17 | 48 例題ではCodeGearとして`factorial`を宣言している。 |
49 `factorial`はCodeGearの引数として`struct F`型の変数`arg`を受け取り、`arg`のメンバー変数によって`factorial`の再帰呼び出しを行う。 | |
18 | 50 `arg`の様なCodeGearの引数のことを`DataGear`と呼ぶ。 |
17 | 51 CodeGearの呼び出しは`goto`文によって行われる。 |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
52 この例題を状態遷移図にしたものを図\ref{fig:factorial_cbc}に示す。 |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
53 図中の四角がDataGear、 円がCodeGearに対応する。 |
14 | 54 |
55 | |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
56 ``` lab:src:cbc_example, cap:CbCで階乗を求める例題 |
15 | 57 __code factorial(struct F arg) { |
58 if (arg.n<0) { | |
59 exit(1); | |
60 } | |
61 if (arg.n==0) { | |
62 goto arg.next(arg); | |
63 } else { | |
64 arg.r *= arg.n; | |
65 arg.n--; | |
66 goto factorial(arg); | |
14 | 67 } |
68 } | |
15 | 69 ``` |
14 | 70 |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
71 ![lab:fig:factorial_cbc, cap:CbCで階乗を求める例題の状態遷移](fig/factorial_cbc.pdf) |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
72 |
17 | 73 CodeGearは関数呼び出し時のスタックを持たない為、一度あるCodeGearに遷移してしまうと元の処理に戻ってくることができない。 |
74 しかしCodeGearを呼び出す直前のスタックは保存されるため、 部分的にCbCを適用する場合はCodeGearを呼び出す`void`型などの関数を経由することで呼び出しが可能となる。 | |
75 | |
76 この他にCbCからCへ復帰する為のAPIとして、 環境付きgotoという機能がある。 | |
77 これはGCCでは内部コードを生成、 LLVM/clangでは`setjmp`と`longjmp`を使うことでCodeGearの次の継続対象として呼び出し元の関数を設定することが可能となる。 | |
78 したがってプログラマから見ると、通常のCの関数呼び出しの返り値をCodeGearから取得する事が可能となる。 | |
79 | |
20 | 80 # CbCを用いたOSの実装 |
81 | |
82 軽量継続を持つCbCを利用して、 証明可能なOSを実装したい。 | |
83 その為には証明に使用される定理証明支援系や、 モデル検査機での表現に適した状態遷移単位での記述が求められる。 | |
84 CbCで使用するCodeGearは、 状態遷移モデルにおける状態そのものとして捉えることが可能である。 | |
22 | 85 CodeGearを元にプログラミングをするにつれて、 CodeGearの入出力のDataも重要であることが解ってきた。 |
86 CodeGearとその入出力であるDataGearを基本としたOSとして、 GearsOSの設計を行っている。 | |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
87 現在のGearsOSは並列フレームワークとして実装されており、 実用的なOSのプロトタイプ実装として既存のOS上への実装を目指している。 |
22 | 88 |
89 GearsOSでは、 CodeGearとDataGearを元にプログラミングを行う。 | |
21 | 90 遷移する各CodeGearの実行に必要なデータの整合性の確認などのメタ計算は、 MetaCodeGearと呼ばれる各CodeGearごと実装されたCodeGearで計算を行う。 |
22 | 91 このMetaCodeGearの中で参照されるDataGearをMetaDataGearと呼ぶ。 |
23 | 92 |
93 各CodeGearの入出力や、各CodeGearそのものの関数ポインタなどは、関数型プログラミングの側面から見るとプログラマが直接操作するのを禁じる必要がある。 | |
94 このためにGearsOSには実行する処理に必要なCodeGear及びDataGearを管理する、 contextというMetaDataGearが存在する。 | |
95 コード上では別のCodeGearに直接遷移している様に見えるが、 実際はContext内の遷移先のCodeGearに対応するスロットから、対応するMetaCodeGearに遷移する。 | |
25
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
96 CodeGearから別のCodeGearに遷移する際のDataGearなどの関係性を、図\ref{meta-cg-dg}に示す。 |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
97 ![lab:meta-cg-dg, cap:CodeGearとMetaCodeGear](./fig/meta-cg-dg.pdf) |
87813fb8542c
add factorial_cbc.pdf
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents:
24
diff
changeset
|
98 これらの変換はPerlスクリプトによってGearsOSのビルド時に行われる。 |
18 | 99 |
22 | 100 # xv6 kernel |
101 | |
102 xv6とはマサチューセッツ工科大学でv6 OSを元に開発された教育用のUNIX OSである。 | |
103 xv6はANSI Cで実装されており、 x86アーキテクチャ上で動作する。 | |
104 Raspberry Pi上での動作を目的としたARMアーキテクチャのバージョンも存在する。 | |
105 本論文では最終的にRaspberry Pi上での動作を目指しているために、 ARMアーキテクチャ上で動作するxv6を扱う。 | |
106 | |
107 xv6は小規模なOSだがファイルシステム、 プロセス、システムコールなどのUNIXの基本的な機能を持つ。 | |
108 またユーザー空間とカーネル空間が分離されており、 シェルやlsなどのユーザーコマンドも存在する。 | |
109 | |
110 本論文ではxv6のファイルシステム関連の内部処理と、システムコール実行時に実行される処理について分析を行う。 | |
111 xv6 kernelのファイルシステムは階層構造で表現されており、 最も低レベルなものにディスク階層、 抽象度が最も高いレベルのものにファイル記述子がある。 | |
112 | |
18 | 113 |
15 | 114 # xv6のファイルシステムの一部の分析 |
115 | |
116 xv6のファイルシステムに関する定義ファイルはfs.c中に記述されている。 | |
117 この中に出てくる関数に着目し、 この関数をさらにCodeGearに変換していくことで状態遷移単位での記述を試みた。 | |
118 | |
119 まず関数内でif文などの分岐を持たない基本単位であるBasic Blockに着目した。 | |
120 CbCのCodeGearの粒度はCの関数とアセンブラの中間であるといえるので、 BasicBlockをCodeGearに置き換える事が可能である。 | |
17 | 121 したがって特定の関数内の処理のBasicBlockを分析し、 BasicBlockに対応したCodeGearへ変換することで状態遷移系への変換を行った。 |
15 | 122 |
123 |