65
|
1 # GearsOSの分散ファイルシステムの設計
|
68
|
2 author: 一木 貴裕, 河野 真治
|
|
3
|
|
4 profile: 琉球大学理工学研究科情報工学専攻 河野研究室
|
|
5
|
65
|
6 lang: Japanese
|
68
|
7
|
65
|
8 code-engine: coderay
|
|
9
|
|
10
|
68
|
11 ## OSと密に結合したファイルシステムの設計
|
|
12 - 信頼性と拡張性の保証を目的としたGearsOSを開発中
|
|
13 - GearsOSの分散ファイルシステムを開発したい
|
|
14 - 分散フレームワークChristieの構成をもとにする
|
|
15 - Christieが持つTopologyManagerという機能を使う
|
|
16 - プログラムの通信とストレージの接続を管理する
|
65
|
17
|
67
|
18 ## 従来のファイルシステムの問題点
|
68
|
19 - データベースになっていない
|
|
20 - 重複度やリカバリをアプリケーションが担当している
|
|
21 - 暗号化などのセキュリティもアプリケーションが担当している
|
|
22 - OS自体がこれらの機能を持つのが望ましい
|
|
23
|
|
24 ### 従来のファイルシステムのトランザクション
|
|
25 - レコードのTransactionとして提供していない
|
|
26 - 提供しているのは
|
|
27 - ファイルのロック
|
|
28 - ディレクトリの名前の置き換え
|
|
29 - FileSystemのAPIを総括してトランザクションとして設計したい
|
|
30
|
|
31 ### ファイルの型
|
|
32 - OSレベルから見たファイルの型が存在しない
|
|
33 - 実行形式のみをOSが認識している
|
|
34 - 型の区別はアプリケーションに委ねられている
|
|
35 - lsとreadmeなどの型の区別がつかない
|
|
36 - OS自体がファイルの型を見分けるように設計したい
|
|
37
|
|
38 ### ファイルの名前自体がデータベースのkeyとなっていない
|
|
39 - 従来ではファイル固有のIDとファイル名を紐付けしたりする
|
|
40 - 様々なファイル単位が混同になっている
|
|
41 - 複数のレコード
|
|
42 - 複数の表
|
|
43 - sqlite3
|
|
44 - OS自体がユニークなファイルIDのリストを保持する設計にしたい
|
|
45
|
|
46 ### 重複度とファイルリカバリ
|
|
47 - ファイルの複製が行われた際の安全性が確保できない
|
|
48 - バックアップデータを勝手な場所に置かれてしまう
|
|
49 - バックアップデータをOSが管理する
|
|
50
|
|
51 ### 署名と暗号化
|
|
52 - ファイルの署名もしくは暗号化の機能をOSファイルシステムに持たせたい
|
|
53 - 公開鍵と秘密鍵
|
|
54 - 秘密鍵を持つファイルを作成したユーザと公開鍵を持つ任意のユーザが相互にエンコードとデコードが行える仕組み
|
|
55 - 署名はファイルにメタデータとして保持できるようにする
|
|
56 - 鍵の管理もOSが担うようにしたい
|
|
57
|
|
58 ## OSの信頼性について
|
|
59 - アプリケーションを動かすOSには高い信頼性が保証されるべきである
|
|
60 - OSの処理やコードの量は膨大になる
|
|
61 - テストコードを用いた信頼性の保証は困難であると言える
|
|
62 - 数学的な背景に基づいた形式手法を用いて検証したい
|
|
63 - 定理支援証明
|
|
64 - モデル検査
|
|
65 - OSを形式手法にて証明するには状態遷移単位での記述が求められる
|
|
66 - GearsOSはメタレベルとノーマルレベルの計算を分離して記述が行える構成である
|
|
67 - メタレベルの計算でプログラムの整合性を検証する
|
65
|
68
|
|
69 ## Continuation based C(CbC)
|
68
|
70 - CbCとはC言語の下位言語である
|
|
71 - CbCは関数呼び出しでなくjmp命令で移動する継続を導入している
|
|
72 - jmp命令でコード間を移動することにより軽量な継続を実現している
|
|
73 - CbCでは継続を用いてfor 文などのループ文を実装する
|
|
74 - Gearというプログラム概念を持つ
|
66
|
75 - CbCでは関数の代わりにCodeGearという単位でプログラムを行う
|
|
76 - CodeGearによる記述は形式手法に必要な状態遷移そのものとして見ることができる。
|
65
|
77
|
67
|
78 ## Gearsの概念
|
68
|
79 - CodeGear:従来のプログラムやスレッド
|
|
80 - DataGear:変数データ
|
|
81 - CodeGearはDataGearと呼ばれる変数データを入力として受け取る
|
|
82 - CodeGearの処理結果を別のDataGear に書き込む
|
|
83 - 入力のDataGearをInputDataGear
|
|
84 - 出力されるDataGearをOutputDataGear
|
65
|
85 - CodeGearが参照できるDataGearはInput/output DataGearに限定される。
|
68
|
86 - CodeGearは関数呼び出しのスタックを持たない
|
|
87 - 一度コードブロックを遷移すると元の処理に戻ってこられない
|
65
|
88
|
66
|
89 <center><img src="https://i.imgur.com/zCiaOrY.jpg" width="500px"></center>
|
|
90 <center>
|
|
91
|
65
|
92
|
|
93 ## GearsOS
|
68
|
94 - CbCを用いて記述されたOSである
|
|
95 - CodeGearとその入出力であるDataGearを基本とする
|
|
96 - 現在は並列フレームワークとして実装されている
|
|
97 - 実用的なOSのプロトタイプとして実装を目指している
|
|
98 - ノーマルレベルからではCodeGearの遷移は単純にCodeGearがDataGearをInput/Outputを繰り返し、コードブロックを移動するように見える
|
|
99 - 実際にはCodeGearから別のCodeGearへの遷移の際、データ整合性の確認などのメタ計算が加わる
|
|
100 - これをMetaCodeGearと呼ぶ
|
|
101 - MetaCodeGearはCodeGearごとに実装される
|
|
102 - MetaCodeGear内で参照されるDataGearをMetaDataGearと呼ぶ
|
|
103 - MetaCodeGearやMetaDataGearはプログラマが直接実装することはない
|
|
104 - 現在はPerlスクリプトにより、GearsOSのビルド時に生成される
|
65
|
105
|
|
106 <center><img src="https://i.imgur.com/eL9rOF5.jpg" width="500px"></center>
|
|
107 <center>
|
|
108 CodeGearから別のCodeGearへ遷移する際のDataGearなどの関係性
|
|
109 </center>
|
|
110
|
|
111 ## Christie
|
68
|
112 - Christieは並列分散フレームワークである
|
|
113 - java言語で構成される
|
|
114 - GearsOSと似てはいるが別のGearというプログラミング概念をもつ
|
|
115 - Gearは以下の四種類が存在しする。
|
65
|
116 - CodeGear (CG) : スレッド、クラス
|
|
117 - DataGear (DG) : 変数データ
|
|
118 - CodeGearManager (CGM) : ノード
|
|
119 - DataGearManager (DGM) : データプール
|
|
120
|
|
121
|
|
122 ### CodeGear(以下CG)
|
68
|
123 - DataGearを参照しながらプログラムを実行する
|
|
124 - 処理に必要なDataGearのkeyをプログラム内に記述する必要がある
|
|
125 - CGMがsetupという処理を行うことで待ち合わせが始まる
|
|
126 - プログラム(CG)内に記述された全てのDataGearのkeyにデータが格納されると実行される
|
|
127
|
65
|
128 ### DataGear(以下DG)
|
68
|
129 - keyと変数データの組み合わせで構成される
|
|
130 - アノテーションを用いて記述する
|
|
131 - アノテーションの種類によりkeyの変数データの参照方法が変わる
|
|
132
|
65
|
133 ### CodeGearManager(以下CGM)
|
68
|
134 - CodeGear,DataGear,DataGearManagerを管理する
|
|
135 - 分散処理のノードに相当する
|
|
136 - それぞれポートを持つ
|
|
137 - putという操作でDagaGearを任意のCGMの持つDataGearManagerに格納する
|
66
|
138
|
65
|
139 ### DataGearManager(以下DGM)
|
68
|
140 - 各CodeGearManagerが1つづつ所持している
|
|
141 - データプールになっておりCGMが利用するDGを全て保持している
|
|
142 - LocalDGMとRemoteDGMの二種類存在する(後述)
|
65
|
143
|
68
|
144 ## Christieのコード例
|
65
|
145 - Christieを用いてHelloWorldを記述した際のコードが以下となる。
|
|
146 ```
|
|
147 public class StartHelloWorld extends StartCodeGear {
|
|
148
|
|
149 public static void main(String[] args){
|
|
150 CodeGearManager cgm = createCGM(10000); //CGMの作成
|
|
151 cgm.setup(new HelloWorldCodeGear()); //CGMにCGをsetupする
|
|
152 cgm.getLocalDGM().put("hellokey","hello"); //setupされたCGが持つDGのkeyにデータを設定する
|
|
153 cgm.getLocalDGM().put("hellokey","world");//同上
|
|
154 }
|
|
155 }
|
|
156 ```
|
|
157
|
|
158 ```
|
|
159 public class HelloWorldCodeGear extends CodeGear {
|
|
160
|
|
161 @Take //アノテーション
|
66
|
162 String hellokey; //待ち合わせ&プログラム内で使用するDataGear
|
65
|
163
|
|
164 @Override
|
|
165 protected void run(CodeGearManager cgm) { //CGの処理内容
|
|
166 System.out.print(hellokey + " ");
|
|
167 cgm.setup(new HelloWorldCodeGear());
|
|
168 }
|
|
169 }
|
|
170 ```
|
|
171
|
|
172
|
67
|
173 ## LocalDGMとRemoteDGM
|
68
|
174 - LocalDGMは各ノード固有のデータプールである
|
|
175 - RemoteDGMは他ノードのLocalDGMに対応するプールである
|
|
176 - 接続しているノードの数だけ存在する
|
|
177 - DGMのput操作を行う際にはLocalとRemoteのどちらかを選ぶ
|
|
178 - Localであれば、LocalのCGMが管理するDGMに対しDGを格納する
|
|
179 - RemoteDGMを指定してputすると、接続している任意のノードにDGを送信する
|
|
180 - CGMの接続をする=接続先のRemoteDGMを作成する
|
65
|
181
|
|
182 ![](https://i.imgur.com/BJNVkii.jpg)
|
|
183
|
|
184
|
|
185 ## TopologyManager
|
68
|
186 - Christieがもつ通信形成を簡潔に行う機能である
|
|
187 - Topologyに参加を表明したノードを自動的に配線する
|
|
188 - Topologyの形状に合わせ、各ノードにRemoteDGMを作成する
|
|
189 - ノードは相対的に接続された別のノードにラベルをつけ参照することができる
|
|
190 - ソケット接続などの処理を全てTopologyManagerに任せることができる
|
65
|
191
|
|
192
|
66
|
193 ## GearsOSのファイルアクセスAPI
|
68
|
194 - WordCount例題を通して構築する
|
|
195 - WordCount
|
|
196 - 指定したファイルの中身の文字列を読み取る
|
|
197 - 文字数と行列数のcount
|
|
198 - 加えて文字列を出力する
|
|
199 - WordCountのコードブロックは大きく分けて二つに分類できる
|
|
200 - FileOpenスレッド
|
|
201 - 指定した名前のファイルをFile構造体としてOpenする
|
|
202 - ファイル内文字列を1行づつブロックとしてWordCountスレッドに送信する
|
|
203 - WordCountスレッド
|
|
204 - 文字列のブロックを受け取る
|
|
205 - 文字列を表示する
|
|
206 - 文字数と行列のCountUpをする
|
|
207 - WordCountとファイルの接続はプログラムの外で接続される
|
|
208 - 将来的にChristieのTopologyManagerで接続を行いたい
|
65
|
209
|
66
|
210 <center><img src="https://i.imgur.com/IFffeMq.jpg" width="600px"></center>
|
65
|
211
|
68
|
212 ## 競合アクセスを可能とするChristieAPI
|
|
213 - GearsOS上のファイルは名前のついた大域的な資源として扱われる
|
|
214 - 複数のCodeGearから競合的にアクセスされる場合がある
|
|
215 - 上記のAPIではファイルとWordCountが直接的に結合されている
|
|
216 - 競合的なアクセスには対応していない
|
|
217 - Christieを元とした、DataGearsStreamに名前をつけてアクセスするAPIを導入する
|
65
|
218
|
66
|
219
|
|
220 <center><img src="https://i.imgur.com/K3nYFkh.jpg" width="600px"></center>
|
|
221 <center>
|
68
|
222 WordCountをRemoteDGMを用いて構成する際の協調図
|
66
|
223 </center>
|
|
224
|
68
|
225 - NodeAにて任意のファイルを開く
|
|
226 - ファイルの中身を1行ごとに文字列をNodeBに送信する
|
|
227 - NodeBにてWordCountの処理(countup,文字列表示など)を行う
|
|
228 - ackとしてフラグをNodeAに返信する
|
|
229 - 文字列ブロックの送信と受け取りのフラグのやり取りでループする
|
|
230 - NodeBがeofをフラグとしてNodeAから受け取った場合、WordCountの結果を表示する
|
|
231 - 両ノードの処理の終了を行う
|
|
232 - NodeA,B間のファイル内文字列のBlockとフラグの送受信は、RemoteDGMを介して行う
|
|
233 - RemoteDGMにはkeyとデータの組み合わせとなる(Christie仕様の)DataGearが必要となる。
|
|
234 - DGのpushにあたる操作はmeta部分で実装を行う
|
66
|
235
|
|
236
|
|
237 ## FileSystem Implementation
|
68
|
238 - GearsOS FileSystemは単なるDGのリストとなる
|
|
239 - これはDataGearManagerにあたる
|
|
240 - ファイルの中身を要求された際、リスト内部のDGを順次に送受信する形となる
|
|
241 - 別ノードからファイルを参照する際はRemoteDGMを通してファイルの中身を送受信する
|
|
242 - 持続的なファイルシステムとして保存する場合、DGのリストをSSDなどのデバイスに格納する
|
|
243 - メモリ領域において不要となったメモリはmeta部分にて回収を行う
|
|
244
|
66
|
245
|
|
246 <center><img src="https://i.imgur.com/lcqdiSx.jpg" width="600px"></center>
|
|
247 <center>
|
68
|
248 ファイルを別ノード上から参照する際の図
|
66
|
249 </center>
|
|
250
|
|
251
|
|
252 ## File Persistency
|
68
|
253 - 持続性のあるファイルとして保存されたDGMを操作するには、SSDなどデバイス上に保存されたDGMをLocalDGMとして呼び出せば良い
|
66
|
254 <center><img src="https://i.imgur.com/GWzj9qW.jpg " width="600px"></center>
|
|
255 <center>
|
|
256 <center>
|
68
|
257 デバイス上に保存されたDGMを呼び出す際の図
|
66
|
258 </center>
|
|
259
|
65
|
260
|
68
|
261 ## UNIX FileSystemとの比較
|
|
262 - UNIX FileSystem において File Stream と Socket Stream は煩雑な処理が必要となる
|
|
263 - GearsOSではSocket Stream部分をTopologyManagerが担う
|
|
264 - FileStreamはmetaCodeGear部分で実装することでユーザレベルから隠蔽することができる
|
|
265 - UNIXではStreamに型がないので不完全なデータが生じてしまう
|
|
266 - GearsOSではこれらはDGMのメタな機能として実装することができる
|
|
267 - UNIXファイルシステムにはfsckと呼ばれる修復機能があるが、メモリに対する修復機能は存在しない。
|
|
268 - GearsOSではメモリの一部不良に対応する機能をDGMとして作るといったことが考えられる。
|
|
269 - GearsOSではDGMの名前とその中のDataGear Streamに対応するkeyでアクセスする対象が決まる
|
|
270 - 自由な名前空間の構成が行える
|
|
271 - これはUNIXでいうi-node番号に相当する
|
|
272
|
66
|
273 ## まとめ
|
68
|
274 - GearsOS におけるファイルシステム API の設計を議論した
|
|
275 - 現在のファイルシステムの問題点
|
|
276 - Gearsファイルシステムに搭載する機能の考察
|
|
277 - GearsファイルシステムのAPIは二種類が存在する
|
|
278 - アプリケーションで閉じた決定的な実行を行う直接接続したもの
|
|
279 - DataGearManagerに名称をつけ、競合的なアクセスを許可するもの
|
|
280 - ファイルはDataGearManager
|
|
281 - DataGearManagerは分散環境での通信でもある
|
|
282 - 精進して実装していきたい |