# HG changeset patch
# User suikwasha
# Date 1360866366 -32400
# Node ID a2ea38dd7c86e0a79ea810087de1184bc7f584dd
# Parent 405fdfcca4f723087da0b11846232175b3d26fd7
changed color , added new graph
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/read_4cores.png
Binary file images/read_4cores.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/read_bldsv10.png
Binary file images/read_bldsv10.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/read_kvm_4cores.png
Binary file images/read_kvm_4cores.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/write_4cores.png
Binary file images/write_4cores.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/write_bldsv10.png
Binary file images/write_bldsv10.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 images/write_kvm_4cores.png
Binary file images/write_kvm_4cores.png has changed
diff -r 405fdfcca4f7 -r a2ea38dd7c86 index.html
--- a/index.html Fri Feb 15 00:27:55 2013 +0900
+++ b/index.html Fri Feb 15 03:26:06 2013 +0900
@@ -15,12 +15,17 @@
概要
+
+
従来, ウェブサービスはサーバーで処理, クライアントが結果を表示という方法を取ってきた.
しかし, リクエストの増大によりスケーラビリティ確保が問題となっている.
確保の方法としては,サーバーを分散させるだけでクライアントを有効活用しないことが多い.
我々は, 非破壊木構造を用いてコンテンツを表現し push/pull 方式を用いて, コンテンツを管理する.
- その方法を用いて分散コンテンツマネージメントシステムの開発を行った.
+ その方法を用いて分散コンテンツマネージメントシステムに必要である非破壊的木構造データベースのJungleの開発とその検証を行い, 分散データベースCassandraよりよい性能を得ることが出来た.
+
+
+
通常のウェブサービス
@@ -50,12 +57,13 @@
スケーラビリティを上げる方法は?
- - スケールアップ
- - スケールアウト
+ - スケールアップ : 高価なサーバーを買う
+ - スケールアウト : 安価なサーバーを複数用意して利用する
という2種類の方法がある.
-
+
+
+
コンテンツマネージメントシステム (CMS)
コンテンツマネージメントシステムとは, Webコンテンツを構成するテキストや画像などのデジタルコンテンツを管理するためのシステム.
@@ -108,14 +118,17 @@
では, どのようにしてスケーラビリティを確保すれば良いのだろうか?
+
スケーラブルにするためには?
スケーラブルにするのは簡単ではなく, いくつかの弊害が存在する.
弊害は, そのシステムの要求する性質によって変化する.
- 例えば, 分散データベースはデータの整合性が大事であり, 実現するためにはどのような方法があるか?
+ 例えば, 銀行のシステムはデータの整合性が大事で, ある場所から預金されたお金が別の場所から見えない状態は起きてはならない.
+
+
コンテンツマネージメントシステムでの整合性
@@ -164,7 +179,7 @@
スケーラブルにするためには?
以上の事柄より次の方法が考えられる.
-
+
- データの更新を受けたノードが一定時間ごとに, 他のノードへ通知する. 最新データは自分のみに書き込む
- ノードは一定時間ごとに他のノードから更新がないかチェックし, リクエストを受けたときは自分の保持するデータを利用する
@@ -197,6 +212,8 @@
+
+
+
+
+ 非破壊的木構造
+
+
+ 編集対象までパス上に存在するノードをルートノードに向かって, コピーする. 編集対象のノードはコピーする際にAとしてコピーする
+ コピーしたノードに一つ前にコピーしたノードを子供として追加する.
+
+
+
+
+
+
非破壊的木構造
@@ -248,7 +280,7 @@
Push/Pull方式
Push/Pull方式とは,
-
+
- データを定期的にまとめて通知するPush処理
- データを定期的に更新するPull処理
@@ -257,23 +289,17 @@
非破壊的木構造をPush/Pullすることで, 分散しているコンテンツマネージメントシステムに通知する.
この方式は, 分散バージョン管理システムでも利用されている.
+
+
Push/Pull方式
この方式を用いることにより, 前述した
-
+
- データの更新を受けたノードが一定時間ごとに, 他のノードへ通知する. 最新データは自分のみに書き込む
- ノードは一定時間ごとに他のノードから更新がないかチェックし, リクエストを受けたときは自分の保持するデータを利用する
@@ -306,6 +332,8 @@
+
+
分散コンテンツマネージメントシステムの設計
@@ -333,23 +363,28 @@
非破壊的木構造データベースJungle
+
+
JungleはJavaを用いて開発した非破壊的木構造データベースである. 以下に特徴を示す.
- 複数の非破壊的木構造を定義できる.
- データベースは非破壊的木構造の編集履歴をすべて保持する.
- APIが通常の破壊的木構造のAPIと異なり, 非破壊的であることを意識できるようになっている.
+
非破壊的木構造データベースJungleの検証
- これまでに, 非破壊的木構造データベースJungleの概要やその利用方法について述べた.
+
+
次に我々は, Jungleの性能を検証するために, Cassandraと比較する.
Cassandraとは, スケーラブルな分散KeyValueStoreデータベースである.
+
@@ -450,14 +485,13 @@
非破壊的木構造データベースJungleの検証
- サーバーとクラスタがそれぞれ2種類あるため, 本検証では合計4組み合わせの検証を行う
+ サーバーとクラスタがそれぞれ2種類あるため, 本検証では合計3組み合わせの検証を行う
- コア数の多いサーバー と VMWareクラスタ
- コア数の少ないサーバー と VMWareクラスタ
- - コア数の多いサーバー と KVMクラスタ
- - コア数の少ないサーバー と KVMクラスタ
+ - KVMクラスタの検証結果 と VMWareクラスタの検証結果の比較
@@ -475,7 +509,7 @@
書き込みの実験結果 |
- JungleがCassandraより僅かながら上回っているが, ノード数25のところで追いぬかれている部分もある.
+ JungleがCassandraより僅かながら上回っているが, ノード数25のところで追いぬかれている部分もある. Jungleは木構造がロックフリーなため高い性能が出ている
@@ -500,7 +534,7 @@
非破壊的木構造データベースJungleの検証
- 実験結果 : コア数の少ないサーバー と VMWareクラスタ (書き込み)
+ 実験結果 : コア数の少ないサーバー と VMWareクラスタ
|
@@ -534,33 +568,16 @@
非破壊的木構造データベースJungleの検証
- 実験結果 : コア数の多いサーバー と KVMクラスタ
+ 実験結果 : VMWareクラスタ と KVMクラスタの比較
- |
+ |
- 書き込みの実験結果 |
+ 多コアサーバーを用いたJungleの読み込みの実験結果 |
- 結果の推移の仕方はVMWareの検証と似ているが, 平均時間がVMWareより遅い結果が出ている.
-
-
-
-
- 非破壊的木構造データベースJungleの検証
-
-
- 実験結果 : コア数の多いサーバー と KVMクラスタ
-
-
- |
-
-
- 読み込みの実験結果 |
-
-
- こちらの結果でも, 推移の仕方はVMWareの検証と似ているが, 平均時間がVMWareより遅い結果が出ている.
+ KVMの平均時間がVMWareより遅い結果が出ている. しかし, 結果の推移は似ているため, チューニングの問題と考えられる
@@ -568,42 +585,24 @@
非破壊的木構造データベースJungleの検証
- 実験結果 : コア数の少ないサーバー と KVMクラスタ
-
-
- |
-
-
- 書き込みの実験結果 |
-
-
+ 検証結果の考察1
+
+
+ - JungleとCassandraでは, Jungleのほうが僅かながら速いことが解った.
+ - Cassandraはスケーラブルな分散データベースであり, Jungleと同様に自由にコピーを作成できるデータベースである.
+ - よって, シングルノードでの検証において十分な速度が測定できたことから, マルチノード環境でもCassandra同様にスケールする可能性があることが分る
+
-
+
非破壊的木構造データベースJungleの検証
- 実験結果 : コア数の少ないサーバー と KVMクラスタ
-
-
- |
-
-
- 読み込みの実験結果 |
-
-
-
-
-
-
- 非破壊的木構造データベースJungleの検証
+ 検証結果の考察2
-
- 検証結果の考察
- - JungleとCassandraでは, Jungleのほうが僅かながら速いことが解った.
- - しかし, 多コアサーバーと少ないコアのサーバーでは違いが同じであり. 台数効果を確認できなかった.
+ - 多コアサーバーと少ないコアのサーバーでは違いが同じであり. 台数効果を確認できなかった.
- 多コアサーバーと少ないコアのサーバーでは, 利用しているCPUが同じであるため, 検証対象である掲示板システムを更にチューニングする必要があると思われる.
- VMWareとKVMの比較では, 結果の推移はVMWareと同様であるがKVMのほうが遅いことが確認できた.
- KVMには, 様々なIOに関するオブションが存在し, チューニングの余地が未だあると考えられる.
@@ -619,11 +618,57 @@
- 本研究では, スケーラブルな分散コンテンツマネージメントシステムの開発するために, 非破壊的木構造とPush/Pull方式を用いた方法を提案した.
- 実装では, システムでまず必要だと思われる非破壊的木構造のデータベースJungleの実装を行った.
- 実装したJungleを分散データベースCassandraと比較するために簡易掲示板システムを構築した.
- - 検証では, Cassandraより多少良い結果を得ることが出来たが, コア数での台数効果は確認できなかった.
+ - 検証では, Cassandra良い結果を得ることが出来た. Cassandraは分散データベースであるため, 分散したJungleの性能にも期待が持てる.
- VMWareクラスタとKVMクラスタの比較では, KVMクラスタでの結果がVMWwareより遅くIO関連のチューニングが必要であることが解った.
+
+
+ 今後の課題
+
+
+ メモリ使用量の問題
+ Jungleは非破壊的木構造データベースであるため, すべての木構造を保持する.
+ そのため, メモリ上に使われない木構造も居座ることになり, かつ, GCで掃除されることがない.
+ この問題を解決するために, ある程度使われなくなった木構造は外部に書き出す必要がある.
+
+
+
+
+ 今後の課題
+
+
+ KVMチューニングの問題
+ 現在のKVMクラスタはVMWare程度の性能が出ていないのが検証からわかっている.
+ KVMにはvirtioなどのIO関連の設定が多数存在しており, それらのチューニングをする必要があると考えられる.
+
+
+
+
+ 今後の課題
+
+
+ 永続化の問題
+ 現在のJungleの実装では永続化が未実装である.
+ 永続化は, Jungleのインターフェイスをファイルシステム用に実装することで,
+ ファイルシステム上に同様にして木構造のファイルを構築することができると考えられる
+
+
+
+
+
+
+
+ マージ処理
+ Push/Pull方式を採用した場合, Push先またはPull先の木構造と更新が衝突するおそれがある.
+ その場合は, 2つの木のマージを行う.
+
+
+
+
+
+