Papers/2016/masa-master: c3.tex comparison

comparison c3.tex @ 16:a3c5125aea03

add images

author	Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
date	Wed, 20 Jan 2016 17:02:45 +0900
parents	c686d33ba1c7
children	14545e517fb0

comparison

equal deleted inserted replaced

-:c686d33ba1c7
+:a3c5125aea03
-\chapter{正規表現の設計と実装}
+\chapter{並列処理向け I/O}
-\section{正規表現構文木の生成}
+ファイル読み込みなどの I/O を含むプログラムは、読み込み時間が Task の処理時間と比較してオーバーヘッドになることが多い。
-\section{Transition List の生成}
+計算処理の並列化を図ったとしても I/O がボトルネックになってしまい処理全体が高速にならない。
-\section{Subset Construction}
+本項では Cerium に実装した並列処理用 I/O を行ない、I/O 部分の高速化を図った。
-\section{Cerium 上での実装}
+Cerium の例題ではファイル読み込みを mmap にて実装していた。
+しかし、mmap だとファイルを読み込んでから Task を実行するので、読み込んでいる間は他の CPU が動作せず並列度が落ちる。
+mmap は function call 後にすぐにファイルを読みに行くのではなく、仮想メモリ領域にファイルの中身を対応させる。
+その後メモリ空間にアクセスされたときに、OS が対応したファイルを読み込む。
+また、読み込む方法が OS 依存となってしまうため環境に左右されやすく、プログラムの書き手が読み込みの制御をすることが難しい。
+図\ref{fig:mmap}は mmap で読み込んだファイルに対して Task1 、 Task2 がアクセスしてそれぞれの処理を行うときのモデルである。
+Task1 が実行されると仮想メモリ上に対応したファイルが読み込まれ、読み込み後 Task1 の処理が行われる。
+その後 Task2 も Task1 と同様の処理が行われるが、これら 2 つの Task の間に待ちが入る。
 \begin{figure}[htpb]
 \begin{center}
-\includegraphics[scale=0.2]{images/implementation/CharClassMergePattern.pdf}
+\includegraphics[scale=0.7]{images/cerium/mmap.pdf}
 \end{center}
-\caption{2つの Character Class を merge するときの全パターン}
+\caption{mmap Model}
-\label{fig:CharClassMergePattern}
+\label{fig:mmap}
 \end{figure}
+mmap を使わず、読み込みを独立した Thread で行ない、ファイルを一度に全て読み込むのではなくある程度の大きさ(Block)分読み込み、読み込まれた部分に対して並列に Task を起動する。
+これを Blocked Read と呼び、高速化を図った。
+Blocked Read を実装するにあたり、WordCount を例題に挙げる。
+ファイルを読み込む Task (以下、ReadTask) と、読み込んだファイルに対して計算を行う Task (以下、WordCount) を別々に生成する。ReadTask は一度にファイル全体を読み込むのではなく、ある程度の大きさで分割してから読み込みを行う。分割して読み込んだ範囲に対して WordCount を行う。
+WordCount を Blocked Read で読み込み処理をしたとき以下の図\ref{fig:BlockedRead}の様になる。
 \begin{figure}[htpb]
 \begin{center}
-\includegraphics[scale=0.2]{images/implementation/ccinsert1.pdf}
+\includegraphics[scale=0.5]{./images/cerium/blockedread.pdf}
 \end{center}
-\caption{Character Class を二分木で表示}
+\caption{BlockedRead による WordCount}
-\label{fig:ccinsert1}
+\label{fig:BlockedRead}
 \end{figure}
+Task を一定の単位でまとめた Task Block ごとに生成して WordCount を行なっている。
+Task Block で計算される領域が Blocked Read で読み込む領域を追い越して実行してしまうと、まだ読み込まれていない領域に対して計算されてしまう。
+その問題を解決するために依存関係を適切に設定する必要がある。
+Blocked Read による読み込みが終わってから TaskBlock が起動されるようにするため、Cerium の API である wait\_for にて依存関係を設定する。
+また、ReadTask は連続で処理される必要がある。
+なぜならば、ReadTask でファイルを読み込む前提で WordCount がその領域に対して計算を行うので、ReadTask の処理が遅くなってしまうだけでオーバーヘッドとなってしまう。\ref{fig:BlockedReadModel}
 \begin{figure}[htpb]
 \begin{center}
-\includegraphics[scale=0.2]{images/implementation/ccinsert2.pdf}
+\includegraphics[scale=0.5]{./images/cerium/blockedreadimage.pdf}
 \end{center}
-\caption{ある Character Class の二分木に対して、新しい Character Class を insert}
+\caption{BlockedRead Model}
-\label{fig:ccinsert2}
+\label{fig:BlockedReadModel}
 \end{figure}
+\newpage
+Blocked Read を実装することにより、読み込み部分と処理部分の並列化を行なった。Blocked Read は連続で読み込まれる必要があるため、さらに I/O 専用 thread を実装した。
+Cerium Task Manager では、それぞれの Task に対してデバイスを設定することができる。
+SPE\_ANY 設定をすると、Task Manager が CPU の割り振りを自動的に行う。
+Blocked Read は連続で読み込まれなければならないが、SPE\_ANY で設定すると Blocked Read 間に別の Task が割り込まれる恐れがある。(図\ref{fig:spe_any_blockedread})
 \begin{figure}[htpb]
 \begin{center}
-\includegraphics[scale=0.2]{images/implementation/ccinsertresult.pdf}
+\includegraphics[scale=0.7]{./images/cerium/speblockedread.pdf}
 \end{center}
-\caption{insert 後の Character Class の二分木}
+\caption{BlockedRead と Task を同じ thread で動かした場合}
-\label{fig:ccinsertresult}
+\label{fig:spe_any_blockedread}
 \end{figure}
+Task が Blocked Read 間に割り込まれないようにするため、I/O 専用 thread である iO\_0 の設定を追加した。
+IO\_0 は SPE\_ANY とは別 thread の scheduler で動作するので、SPE\_ANY で動作している Task に割り込むことはない。
+しかし、読み込みの終了を通知し、次の read を行う時に他の Task がスレッドレベルで割り込んでしまう事がある。
+pthread\_getschedparam() で IO\_0 の priority の設定を行う必要がある(図:\ref{fig:iothread_blockedread})。
 \begin{figure}[htpb]
 \begin{center}
-\includegraphics[scale=0.2]{images/implementation/cfab.pdf}
+\includegraphics[scale=0.7]{./images/cerium/iothread.pdf}
 \end{center}
-\caption{cfab}
+\caption{IO Thread による BlockedRead}
-\label{fig:cfab}
+\label{fig:iothread_blockedread}
 \end{figure}
-\begin{figure}[htpb]
+IO\_0 で実行される Task は Blocked Read のみで、さらに IO\_0 の priority を高く設定することにより Blocked Read が他の Task に割り込まれることなく連続に実行される。
-\begin{center}
-\includegraphics[scale=0.2]{images/implementation/cfdg.pdf}
-\end{center}
-\caption{cfdg}
-\label{fig:cfdg}
-\end{figure}
-\begin{figure}[htpb]
-\begin{center}
-\includegraphics[scale=0.2]{images/implementation/cfdgab.pdf}
-\end{center}
-\caption{cfdgab}
-\label{fig:cfdgab}
-\end{figure}
-\begin{figure}[htpb]
-\begin{center}
-\includegraphics[scale=0.2]{images/implementation/efgi.pdf}
-\end{center}
-\caption{efgi}
-\label{fig:efgi}
-\end{figure}
-\begin{figure}[htpb]
-\begin{center}
-\includegraphics[scale=0.2]{images/implementation/dfa.pdf}
-\end{center}
-\caption{dfa}
-\label{fig:dfa}
-\end{figure}
-\begin{figure}[htpb]
-\begin{center}
-\includegraphics[scale=0.2]{images/implementation/nfa.pdf}
-\end{center}
-\caption{nfa}
-\label{fig:nfa}
-\end{figure}

Mercurial > hg > Papers > 2016 > masa-master

comparison c3.tex @ 16:a3c5125aea03