annotate paper/cell.tex @ 3:ea6802db8b12

3章と4章もう少し
author gongo@gendarme.cr.ie.u-ryukyu.ac.jp
date Wed, 04 Feb 2009 17:46:51 +0900
parents 63cbf02d3c9e
children df0056a7b95d
Ignore whitespace changes - Everywhere: Within whitespace: At end of lines:
rev   line source
0
one@firefly.cr.ie.u-ryukyu.ac.jp
parents:
diff changeset
1 \chapter{CELL BROADBAND ENGINE} \label{chapter:cell}
2
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
2
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
3 \section{Cell Broandband Engineの構造}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
4
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
5 ここでは研究、実験題材の対象となった Cell アーキテクチャについて説明する。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
6 Cell Brodband Engine \cite{cell} は、SCEI と IBM によって開発された
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
7 CPU である。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
8 2 thread の PPE (PowerPC Processor Element) と、8個の SPE
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
9 (Synergistic Processor Element) からなる 非対称なマルチコアプロセッサであり、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
10 高速リングバス である EIB (Element Interface Bus) で構成されている。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
11 本研究で用いた PS3Linux (Fedora 10, Yellow Dog Linux 6.0) では、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
12 6個の SPE を使う事ができる (\figref{cell_arch}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
13
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
14 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
15 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
16 \includegraphics[scale=0.8]{./images/cell_arch.pdf}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
17 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
18 \caption{Cell Brodband Engine Architecture}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
19 \label{fig:cell_arch}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
20 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
21
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
22
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
23
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
24 \section{PPE (PowerPC Processor Element)}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
25
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
26 PPE は Cell Broadband Engine のメインプロセッサで、複数の SPE を
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
27 コアプロセッサとして使用することができる汎用プロセッサである。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
28 メインメモリや外部デバイスへの入出力、SPEを制御する役割を担っている。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
29 PPU (PowerPC Processor Unit) は、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
30 PPE の演算処理を行うユニットで、PowerPC アーキテクチャをベースとした
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
31 命令セットを持つ。PPSS (PowerPC Processor Storage Subsystem) は
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
32 PPU からメインメモリへのデータアクセスを制御する
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
33 ユニットである (\figref{cell_ppe}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
34
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
35 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
36 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
37 \includegraphics[scale=0.8]{./images/cell_ppe.pdf}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
38 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
39 \caption{PPE (PowerPC Processor Element)}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
40 \label{fig:cell_ppe}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
41 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
42
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
43 \section{SPE (Synergistic Processor Element)} \label{sec:cell_spe}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
44
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
45 SPE には 256KB の Local Store (LS) と呼ばれる、SPE から唯一、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
46 直接参照できるメモリ領域がり、バスに負担をかける事無く
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
47 並列に計算を進めることが出来る。SPE からメインメモリへは、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
48 直接アクセスすることは出来ず、SPE を構成する一つである
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
49 MFC (Memory Flow Controller) へ、チャネルを介して DMA (Direct Memory Access)
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
50 命令を送ることで行われる (\figref{cell_spe}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
51
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
52 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
53 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
54 \includegraphics[scale=0.8]{./images/cell_spe.pdf}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
55 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
56 \caption{SPE (Synergistic Processor Element)}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
57 \label{fig:cell_spe}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
58 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
59
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
60
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
61 \section{Cell の基本機能}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
62
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
63 \subsection{DMA}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
64 \ref{sec:cell_spe}節 で述べた通り、SPE は LS 以外のメモリに
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
65 直接アクセスすることができず、PPE が利用するメインメモリ上のデータに
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
66 アクセスするには DMA を用いる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
67 DMA (Direct Memory Access) 転送とは、CPU を介さずに周辺装置と
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
68 メモリとの間でデータ転送ことで、Cell の場合は
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
69 メインメモリと LS 間でデータの転送を行う。手順としては以下の様になる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
70
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
71 \begin{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
72 \item SPE プログラムが MFC (Memory Flow Controller) に対して
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
73 DMA 転送命令を発行
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
74 \item MFC が DMA Controller を介して DMA 転送を開始。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
75 この間、SPE プログラムは停止しない。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
76 \item DMA 転送の終了を待つ場合、SPE プログラム内で転送の完了を待つ
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
77 \end{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
78
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
79 この時、DMA 転送するデータとアドレスにはいくつか制限がある。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
80 転送データが 16 バイト以上の場合、データサイズは 16 バイトの倍数で、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
81 転送元と転送先のアドレスが 16 バイト境界に揃えられている必要がある。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
82 転送データが 16 バイト未満の場合、データサイズは 1,2,4,8 バイトで、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
83 転送サイズに応じた自然なアライメントである (転送サイズのバイト境界に
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
84 揃えられている) ことが条件となる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
85
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
86 \subsection{SIMD (Single Instruction Multiple Data)}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
87 Cell では、SPE に実装されている 128 ビットレジスタを用いて
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
88 SIMD を行うことが出来る。SIMD とは、1 つの命令で
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
89 複数のデータに対して処理を行う演算方式である (\figref{cell_simd}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
90
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
91 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
92 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
93 \includegraphics[scale=0.8]{./images/cell_simd.pdf}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
94 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
95 \caption{SIMD (Single Instruction Multiple Data)}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
96 \label{fig:cell_simd}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
97 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
98
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
99 \figref{cell_simd} のスカラ演算は以下のような式に当てはまる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
100
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
101 \begin{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
102 int a[4] = {1, 2, 3, 4};
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
103 int b[4] = {5, 6, 7, 8};
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
104 int c[4];
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
105
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
106 for (int i = 0; i < 4; i++) {
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
107 a[i] + b[i] = c[i];
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
108 }
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
109 \end{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
110
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
111 これに対し、SIMD 演算は以下のようになる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
112
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
113 \begin{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
114 vector signed int va = {1, 2, 3, 4};
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
115 vector signed int vb = {5, 6, 7, 8};
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
116 vector signed int vc;
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
117
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
118 vc = spu_add(va, vb);
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
119 \end{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
120
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
121 Cell の SIMD 演算では、vector 型の変数を用いる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
122
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
123 このように、通常は 4 回計算するところを 1 回の計算で行うことが
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
124 できる反面、すべての演算を 128 ビットで計算するため、なるべく
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
125 効果的に行う様に工夫する必要がある。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
126
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
127 \begin{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
128 int a, b, c;
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
129
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
130 c = a + b;
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
131 \end{verbatim}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
132
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
133 この様な計算の場合でも 128 ビット同士の演算を行うため、無駄が生じる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
134
3
ea6802db8b12 3章と4章もう少し
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 2
diff changeset
135 \subsection{Mailbox} \label{sec:cell_mailbox}
2
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
136
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
137 Mailbox とは SPE の MFC 内の FIFO キューであり、PPE と SPE 間の 32 ビット
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
138 メッセージの交換に用いられる。Mailbox では 3 つの振る舞いが
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
139 出来る様に設計されている (\figref{cell_mailbox}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
140
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
141 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
142 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
143 \includegraphics[scale=0.8]{./images/cell_mailbox.pdf}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
144 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
145 \caption{Mailbox}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
146 \label{fig:cell_mailbox}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
147 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
148
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
149 \begin{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
150 \item SPU Inbound Mailbox \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
151 PPE から SPE へデータを渡すためのキュー。キューのエントリ数は
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
152 実装依存による \cite{cell} が、研究環境では最大4個までのデータを蓄積できる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
153 このキューが空の場合は、SPE は、データがメールボックスに書き込まれるまでは、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
154 命令でストールする。読み出すデータの順番は書き込んだ順番に保証されている。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
155 \item SPU Outbound Mailbox \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
156 SPE から PPE へのデータを渡すためのキュー。研究環境では最大1個までしか
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
157 データが蓄積できない。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
158 \item SPU Outbound interrupt Mailbox \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
159 SPU Outbound Mailbox とほとんど同じだが、このキューでは SPE から
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
160 キューにデータが書き込まれると、PPE に対して割り込みイベントが
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
161 発生し、データの読み出しタイミングを通知する事が出来る。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
162 \end{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
163
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
164 \section{開発環境}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
165
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
166 \subsection{libSPE2}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
167
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
168 libSPE2 とは、PPE が SPE を扱うためのライブラリ群である \cite{libspe2} 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
169 libSPE2 は SPE Context Creation、SPE Program Image Handling、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
170 SPE Run Control、SPE Event Handling、SPE MFC Problem State Facilities、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
171 Direct SPE Acceess for Applications という基本構成でできている。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
172 Cell の基本プログラムは次の様になる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
173
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
174 \begin{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
175 \item create N SPE context
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
176 \item Load the appropriate SPE executable object into each SPE context's local store
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
177 \item Create N threads
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
178 \item Wait for all N threads to terminate
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
179 \end{enumerate}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
180
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
181 \subsection{SPU C/C++ 言語拡張}
3
ea6802db8b12 3章と4章もう少し
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 2
diff changeset
182 SPE では基本的な C 言語の機能の他に、Cell 特有の拡張が行われている
ea6802db8b12 3章と4章もう少し
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 2
diff changeset
183 \cite{cell_cpp} 。
2
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
184 \tabref{cell_cpp} に主な API を記す。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
185
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
186 \begin{table}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
187 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
188 \caption{SPU C/C++ 言語拡張 API}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
189 \label{tab:cell_cpp}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
190 \begin{tabular}{|l|l|}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
191 \hline
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
192 spu\_mfcdma32 & DMA 転送を開始する \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
193 \hline
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
194 spu\_read\_in\_mbox & PPE からの mail を取得する \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
195 \hline
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
196 spu\_write\_out\_mbox & PPE へ mail を送信する \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
197 \hline
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
198 spu\_add、spu\_sub、spu\_mul & SIMD 演算 (加算、減算、乗算) \\
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
199 \hline
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
200 \end{tabular}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
201 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
202 \end{table}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
203
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
204 SPE を効率よく使う上で \tabref{cell_cpp} の様な Cell 特有の API や、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
205 SPE アセンブラ命令を学ぶことが必要となる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
206
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
207 \subsection{SPURS}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
208
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
209 ここでは、現在発表されている Cell の開発環境である SPURS について説明する。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
210
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
211 SPURS は、閉じた並列分散と考えることができる Cell の環境で、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
212 いかに効率よく動作させるかということを考えたシステムである。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
213
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
214 Cell の性能を存分に生かすためには SPE を効率よく使い切ることであり、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
215 SPE の動作を止めることなく、同期を最小限に行う必要がある。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
216 そこで SPURS では SPE を効率よく利用するために、PPE に依存せずに SPE コードを
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
217 選択し、実行することと機能は効率重視で割り切ることを挙げている。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
218 そのため、SPE 上にカーネルを組み込んでいる。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
219
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
220 アプリケーションを複数 SPE で実行するとき、アプリケーションプログラムを
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
221 出来るだけ小さな単位(タスク)に分割し、通信ライブラリを用いて
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
222 タスク間を依存関係で結合する。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
223 LS 常駐のカーネルが、実行可能なタスクを選んで実行していく
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
224 (\figref{cell_spurs_task}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
225
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
226 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
227 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
228 \includegraphics[scale=0.6]{./images/cell_spurs_task}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
229 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
230 \caption{SPURS Task}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
231 \label{fig:cell_spurs_task}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
232 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
233
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
234 %また、アプリケーションを分割するとき、プログラムがデータを伴うとき、
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
235 %ジョブに分割し、並べ替えた上で、カーネルがジョブリストから
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
236 %ジョブを取得して実行する。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
237
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
238 これらの処理はデータを扱うため、SPURS はパイプラインで実行される
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
239 (\figref{cell_spurs_pipeline}) 。
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
240
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
241 \begin{figure}[htb]
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
242 \begin{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
243 \includegraphics[scale=0.6]{./images/cell_spurs_pipeline}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
244 \end{center}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
245 \caption{SPURS Pipeline}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
246 \label{fig:cell_spurs_pipeline}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
247 \end{figure}
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
248
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
249 以上から、SPURS は複数の SPE を効率よく使うためのライブラリとして
63cbf02d3c9e 2章まで
gongo@gendarme.cr.ie.u-ryukyu.ac.jp
parents: 0
diff changeset
250 優れた物であると思われるが、現在一般には公開されていない。