Mercurial > hg > Papers > 2012 > yutaka-master
changeset 19:d17943f59cc3 draft
fix
author | Shinji KONO <kono@ie.u-ryukyu.ac.jp> |
---|---|
date | Sun, 12 Feb 2012 00:37:32 +0900 |
parents | 140aec35135c |
children | 1ea8b5af857e |
files | paper/abstract.tex paper/appendix.tex paper/chapter1.tex |
diffstat | 3 files changed, 22 insertions(+), 14 deletions(-) [+] |
line wrap: on
line diff
--- a/paper/abstract.tex Sat Feb 11 17:06:04 2012 +0900 +++ b/paper/abstract.tex Sun Feb 12 00:37:32 2012 +0900 @@ -1,16 +1,24 @@ \begin{abstract} -並列プログラミングフレームワーク Cerium の改良を行った。 -プログラムは、PPE から Mail 機能を用いて各 SPE に処理が割り振られ並列実行される。 -しかし、 PPE からの Mail 応 答が遅い場合、 SPE の待ち時間が発生し、処理性能が低下する。 -また、Ceirum ではアーキテクチャ依存の記述が避けにくい。 -これらを改良するために TaskArray, ソフトウェアMailQueue, MemorySegment の実装を行った。 -その結果、例題を用いた計測では、Mail 待ちが解消され、FPSが向上し、アーキテクチャ依存の記述を隠蔽することに成功した。 +Cell Broad band Engine 用の並列プログラミングフレームワーク Cerium の改良を行った。 +プログラムは、2 台の汎用 CPU である PPE から Mail 機能を用いて6台ある Vector CPU SPE に処理が割り振られ並列実行される。 +SPEは共有メモリを持たない Cerium ではPPE上での処理が多いことがあり、PPE のMail チェック頻度が下がり、 +SPE の待ち時間が増し処理性能が低下する問題があった。これをMailQueueにより解決した。 +さらに、SPUのタスク終了をまとめるために、複数のTaskをまとめたTaskArrayを導入しタスク終了メールを削減した。 +その結果、例題を用いた計測では、Mail 待ちが解消され、性能が向上した。 +Cell では、DMA転送を明示的に行うが、これはアーキテクチャ依存な処理になる。メインメモリのキャッシュに相当する +機能を持つ MemorySegment を導入し、アーキテクチャ依存の記述を隠蔽することに成功した。 +これにより、Core i7や Xeon のような汎用のメニーコアでもCeriumを有効に使えるする設計となった。 +We have developed parallel programming framework Cerium for Cell Broad Band Engine. +Six SPE (Vector CPU) work in parallel by mails from two SPU (PowerPC). Since +SPE has no shared memory, not a few operation have to be executed in PPE. This makes +mail check interval rather large, resulting SPU waiting time and low performance. +We implemented MailQueue and TaskArray which is a group of task. It reduces number of mails for task finish and +hides mail delay, and we have good bench mark result. -We have developed parallel programming framework Cerium. Program is alloted processing to each SPE using Mail function from PPE, and It's excuted in parallel. -But when Mail reply from PPE is late, the waiting time of SPE occurs, and the treatment performance fails. -Moreover, in Ceirum, it is hard to avoid description of architecture dependence. -To improve these, We implemented TaskArray, Software MailQueue and MemorySegment. -As a result, in the measurement using an exercise, the waiting for Mail was reduced, FPS improved and it succeeded in concealing description of architecture dependence. +Cell uses explicit DMA transfer which is rare in shared memory multi processor. We introduce +MemorySegment which is similar to the main memory cache, which hides architecture dependent +description. By this, Cerium is now usable on general many core architecture such as Core i7 or Xeon. + \end{abstract}
--- a/paper/appendix.tex Sat Feb 11 17:06:04 2012 +0900 +++ b/paper/appendix.tex Sun Feb 12 00:37:32 2012 +0900 @@ -4,5 +4,5 @@ \begin{itemize} \item 金城裕,河野真治,多賀野海人,小林佑亮. ゲームフレームワークCerium TaskManagerの改良, 情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS), April, 2011 \item 金城 裕 , 河野 真治. Fine grain Task Manager Cerium のチューニング, 日本ソフトウェア科学会第27回大会論文集, Sep, 2010 -\item オープンソースカンファレンス2010 Okinawa. Octorber 2010. +\item オープンソースカンファレンス2010 Okinawa. October 2010. \end{itemize}
--- a/paper/chapter1.tex Sat Feb 11 17:06:04 2012 +0900 +++ b/paper/chapter1.tex Sun Feb 12 00:37:32 2012 +0900 @@ -3,8 +3,8 @@ Cell Broadband Engine \cite{cell} は、ソニー・コンピュータエンタテインメント、 ソニー、IBM , 東芝によって開発されたマルチコア CPU である。 -Cell は、1基の制御系プロセッサコア PPE ( PowerPC Processor Element ) と -8基の演算系プロセッサコア SPE ( Synergistic Processor Element ) で構成される。 +Cell は、1基の制御系プロセッサコア PPE ( PowerPC Processor Element ) と +8基の演算系プロセッサコア SPE ( Synergistic Processor Element ) で構成される。 各プロセッサコアは、EIB (Element Interconnect Bus) と呼ばれる高速なバスで接続されている。また、EIB はメインメモリや 外部入出力デバイスとも接続されていて、