0
|
1 \section{Cell}
|
|
2 Cell Broadband Engine \cite{cell} は、SCEI と IBM によって開発された
|
|
3 CPU である。2 thread の PPE (PowerPC Processor Element) と、
|
|
4 8 個の SPE (Synergetic Processor Element) を持ち、
|
|
5 EIB と呼ばれる高速リングバスで構成されている。
|
|
6 本研究で用いた PS3Linux (Fedora 8) では、
|
|
7 6 個の SPE を使うことができる (\figref{fig-cbe}) 。
|
|
8
|
|
9 \begin{figure}[tb]
|
|
10 \begin{center}
|
|
11 \includegraphics[scale=0.41]{figure/cbe.pdf}
|
|
12 \caption{Cell Architecture}
|
|
13 \label{fig-cbe}
|
|
14 \end{center}
|
|
15 \end{figure}
|
|
16
|
3
|
17 SPE には 256KB の Local Store (LS) と呼ばれる、SPE から唯一直接参照できる
|
|
18 メモリ領域があり、バスに負担をかけることなく並列に計算を進めることが出来る。
|
0
|
19 SPE からメインメモリへは、直接アクセスすることは出来ず、
|
|
20 SPE を構成する一つである MFC (Memory Flow Controller) へ、チャネルを介して
|
|
21 DMA (Direct Memory Access) 命令を送ることで行われる (\figref{fig-cbe-spe}) 。
|
|
22
|
|
23 \begin{figure}[tb]
|
|
24 \begin{center}
|
|
25 \includegraphics[scale=0.6]{figure/cbe-spe.pdf}
|
|
26 \caption{Synergetic Processor Element}
|
|
27 \label{fig-cbe-spe}
|
|
28 \end{center}
|
|
29 \end{figure}
|
|
30
|
|
31
|
|
32 SPE はグラフィックスに適した、4 つの固定小数点、浮動小数点を
|
|
33 同時に演算する命令などを持ち、PPE に比べて高速な演算が可能である。
|
|
34 そのため、ほとんどの演算を SPE 上で行わせることが推奨されている。
|