Mercurial > hg > Papers > 2014 > masakoha-thesis > final
annotate paper/chapter5.tex @ 69:3988365f6f03
add eclbkbox.sty
author | Masataka Kohagura <e085726@ie.u-ryukyu.ac.jp> |
---|---|
date | Tue, 25 Feb 2014 05:08:39 +0900 |
parents | 1ff5dde6decf |
children | eaa8a657efe2 |
rev | line source |
---|---|
11
5e67750b1c4f
write chapter label
Masataka Kohagura <e085726@ie.u-ryukyu.ac.jp>
parents:
6
diff
changeset
|
1 \chapter{ベンチマーク} |
0 | 2 \label{chap:poordirection} |
3 | |
4 | |
11
5e67750b1c4f
write chapter label
Masataka Kohagura <e085726@ie.u-ryukyu.ac.jp>
parents:
6
diff
changeset
|
5 \section{実験環境} |
0 | 6 |
65 | 7 \begin{itemize} |
8 \item Mac OS X 10.9.1 | |
9 \item 2*2.66 GHz 6-Core Intel Xeon | |
10 \item Memory 16GB 1333MHz DDR3 | |
11 \item HHD 1TB | |
12 \item file size 10 GB | |
13 \item CPU num 12 | |
14 \item Boyer-Moore String Search で pattern がいくつ含まれているか検索 | |
15 \item ファイルを読み込みから結果が返ってくるまでを測定 | |
16 \end{itemize} | |
0 | 17 |
11
5e67750b1c4f
write chapter label
Masataka Kohagura <e085726@ie.u-ryukyu.ac.jp>
parents:
6
diff
changeset
|
18 \section{結果} |
38 | 19 |
65 | 20 以下の表に実行結果を示す。 |
38 | 21 |
65 | 22 \begin{tiny} |
23 \begin{table}[ht] | |
24 \begin{center} | |
25 \label{table:result} | |
26 \small | |
27 \begin{tabular}[t]{c|r} | |
28 \hline | |
29 読み込み方法 & 平均実行速度(s)\\ | |
30 \hline | |
31 mmap & 154.6 \\ | |
32 \hline | |
33 Blocked Read \& SPE\_ANY & 106.0 \\ | |
34 \hline | |
35 Blocked Read \& IO\_0 & 99.2 \\ | |
36 \hline | |
37 \end{tabular} | |
38 \caption{実行結果} | |
39 \end{center} | |
40 \end{table} | |
41 \end{tiny} | |
38 | 42 |
65 | 43 実験結果より、mmap より Blocked Read \& IO\_0 の実行速度が 36 \% 改善された。 |
44 また、Blocked Read の CPU Type も SPE\_ANY から IO\_0 に変更することによって更に 4 \% の改善が見られた。 | |
47 | 45 |
46 \section{考察} | |
65 | 47 mmap より Blocked Read で実装したほうが速くなったが、これは mmap の読み込み方法が問題であると考える。 |
48 | |
49 I/O を含む例題の場合、シングルコアでの逐次実行であれば、mmap や pread で実装しても、Task は 読み込みを行って文字列検索を行うというシンプルな動作になる。 | |
50 しかし、マルチコアの並列実行であれば、mmap で実装してしまうと、Task それぞれで読み込みを行ってしまうので競合が発生してしまう。 | |
51 | |
52 読み込みの競合が起こらないように Blocked Read にて読み込み部分と文字列検索部分を分けた結果、こちらのほうが速度が向上した。 |