Mercurial > hg > Papers > 2014 > kkb-sigos
changeset 5:679859bf2fe8
rivision
author | Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp> |
---|---|
date | Tue, 22 Apr 2014 14:35:47 +0900 |
parents | 593671347b01 |
children | 8a73ff7d41b2 |
files | bibliography.tex cerium.tex conclusion.tex introduction.tex sigos.aux sigos.bbl sigos.bib sigos.blg sigos.dvi sigos.log sigos.pdf sigos.tex |
diffstat | 12 files changed, 155 insertions(+), 218 deletions(-) [+] |
line wrap: on
line diff
--- a/bibliography.tex Mon Apr 21 22:16:31 2014 +0900 +++ b/bibliography.tex Tue Apr 22 14:35:47 2014 +0900 @@ -3,8 +3,10 @@ \bibitem{akira} {Akira KAMIZATO.}: Cell を用いたゲームフレームワークの提案,琉球大学工学部情報工学科平成19年度学位論文(修士) (2008). + \bibitem{FFTonGPU} {Yasuhiko OGATA, Toshio Endo, Naoya MARUYAMA, Satoshi MATSUOKA}:性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ,東京工業大学 (2008). + \bibitem{toma:2012a} {Daichi TOMA and Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
--- a/cerium.tex Mon Apr 21 22:16:31 2014 +0900 +++ b/cerium.tex Tue Apr 22 14:35:47 2014 +0900 @@ -1,5 +1,5 @@ \section{Cerium} -Cerium は、当初 Cell 用の Fine-Grain Task Manager として当研究室で開発された。 +Cerium は、当初 Cell 用の Fine-Grain Task Manager\cite{gongo:2008a} として当研究室で開発された。 TaskManager, SceneGraph, Rendering Engine の3つの要素から構成されており、今では、PS3 および Linux, MacOS X 上で動作する。 GPGPU の Data Parallel を含めて、同じ形式で並列プログラムを記述することができる。
--- a/conclusion.tex Mon Apr 21 22:16:31 2014 +0900 +++ b/conclusion.tex Tue Apr 22 14:35:47 2014 +0900 @@ -4,5 +4,8 @@ WordCount, FFT を例題に用い、Scheduler の測定も行なった。 OpenCL と CUDA で異なる結果が出たことからそれぞれで最適なチューニングの方法が違うことがわかる。 どちらもチューニングを行えば同等な結果が出ると考えられるのでプロファイラなどを用いて、実装を見直すことが今後の課題となる。 - +また、Cerium は CPU と GPU の同時実に対応している。 +しかし、スケジューリングを行わず Task を CPU, GPU に対し交互に割り振っているため CPU 単体、GPU 単体で実行するより結果が悪くなる。 +Task の割り当てを最適化することで性能を向上させることが予想される。 +スケジューリングの方法として、一度 Task を CPU のみ、GPU のみで実行し、プロファイルを取ることで Task の割り当てを決定するなどが考えられる。 %% 同時実行の話も入れて
--- a/introduction.tex Mon Apr 21 22:16:31 2014 +0900 +++ b/introduction.tex Tue Apr 22 14:35:47 2014 +0900 @@ -1,11 +1,11 @@ \section{はじめに} -GPU の普及と高性能化にともない、GPU の演算資源を画像処理以外の目的にも利用する GPGPU(GPU による汎目的計算)が注目されている。 -GPU 以外にも Cell, SpursEngine, Xeon Phi など様々なプロセッサが存在する。 +GPU の普及と高性能化にともない、GPU の演算資源を画像処理以外の目的にも利用する GPGPU(GPU による汎目的計算)が注目されている。\cite{FFTonGPU} +GPU 以外にも Cell\cite{cell}, SpursEngine, Xeon Phi など様々なプロセッサが存在する。 それぞれのプロセッサを利用するにはそれぞれ異なる API を利用する必要があり、それらの対応に多くの時間を取られてしまいプログラムの性能改善に集中することができない。 また、GPU や Cell などメモリ空間が異なるプロセッサはデータの転送がオーバーヘッドとなるので、データ転送を効率的に行えるかどうかで処理時間が大きく変わる。 -当研究室で開発・改良が行われている並列プログラミングフレームワーク Cerium は様々なプロセッサを統合して扱えるフレームワークを目指している。 -様々なプロセッサを統合して扱えるフレームワークとしてフランス国立情報学自動制御研究所(INRIA)が開発している StarPU がある。 +当研究室で開発・改良が行われている並列プログラミングフレームワーク Cerium\cite{cerium} は様々なプロセッサを統合して扱えるフレームワークを目指している。 +様々なプロセッサを統合して扱えるフレームワークとしてフランス国立情報学自動制御研究所(INRIA)が開発している StarPU\cite{AugThiNamWac11CCPE} がある。 StarPU は Cerium と同じタスクベースの非同期フレームワークである。 %% ちゃんと論文を引用する タスクという単位で記述することで処理とデータを分離し、より効率的に処理を行うことができる。
--- a/sigos.aux Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.aux Tue Apr 22 14:35:47 2014 +0900 @@ -1,4 +1,9 @@ \relax +\citation{FFTonGPU} +\citation{cell} +\citation{cerium} +\citation{AugThiNamWac11CCPE} +\citation{gongo:2008a} \newlabel{fig:calculate_index}{{1}{3}} \newlabel{fig:createTask}{{2}{3}} \newlabel{fig:task_scheduler}{{3}{3}} @@ -20,24 +25,17 @@ \citation{*} \bibstyle{ipsjunsrt} \bibdata{sigos} -\bibcite{osmesa}{1} -\bibcite{sdl}{2} -\bibcite{akira}{3} -\bibcite{amdahl}{4} -\bibcite{opencl:applied}{5} -\bibcite{gongo}{6} -\bibcite{gongo:2008a}{7} -\bibcite{spurs}{8} -\bibcite{cell}{9} -\bibcite{chiaki}{10} +\bibcite{FFTonGPU}{1} +\bibcite{cell}{2} +\bibcite{cerium}{3} +\bibcite{AugThiNamWac11CCPE}{4} +\bibcite{gongo:2008a}{5} \newlabel{table:wordcount}{{4}{6}} \newlabel{table:fft}{{6.1}{6}} -\bibcite{blender}{11} -\bibcite{libspe2}{12} -\bibcite{kono}{13} -\bibcite{mailbox}{14} -\bibcite{toma:2012a}{15} -\bibcite{opencl}{16} -\bibcite{opencl:ref}{17} -\bibcite{yutaka:os}{18} +\bibcite{chiaki}{6} +\bibcite{yutaka:os}{7} +\bibcite{toma:2012a}{8} +\bibcite{opencl}{9} +\bibcite{opencl:ref}{10} +\bibcite{cuda}{11} \gdef\ipsj@lastpage{7}
--- a/sigos.bbl Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.bbl Tue Apr 22 14:35:47 2014 +0900 @@ -1,59 +1,36 @@ \begin{thebibliography}{10} -\bibitem{osmesa} -: {The Mesa 3D Graphics Library}, \url{http://www.mesa3d.org/}. +\bibitem{FFTonGPU} +{Yasuhiko OGATA, Toshio Endo, Naoya MARUYAMA, Satoshi MATSUOKA}: + 性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ,情報処理学会論文誌 + コンピューティングシステム (2008). -\bibitem{sdl} -: {Simple DirectMedia Layer}, \url{http://www.libsdl.org/}. - -\bibitem{akira} -{Akira KAMIZATO}: {Cell - を用いたゲームフレームワークの提案},{琉球大学理工学研究科情報工学専攻 - 平成19年度学位論文} (2008). +\bibitem{cell} +{Sony Corporation}: {Cell broadband engine architecture} (2005). -\bibitem{amdahl} -{Brian Goetz, Tim Peierls, Joshua Bloch, Joseph Bowbeer, David Holmes, and Doug - Lea}: {\em {Java Concurrency in Prac-tice}}, {Addison-Wesley Professional} - (2005). +\bibitem{cerium} +: {SourceForge.JP: Cerium Rendering Engine}, + {https//sourceforge.jp/projects/cerium/}. -\bibitem{opencl:applied} -{北山洋幸}\:{OpenCL応用 メニーコアCPU \& - GPGPU時代の並列処理},{カットシステム} (2012). - -\bibitem{gongo} -: {SourceForge.JP: Project Info - Cerium Rendering Engine}, - \url{https://sourceforge.jp/projects/cerium/}. +\bibitem{AugThiNamWac11CCPE} +Augonnet, C., Thibault, S., Namyst, R. and Wacrenier, P.-A.: {StarPU: A Unified + Platform for Task Scheduling on Heterogeneous Multicore Architectures}, {\em + Concurrency and Computation: Practice and Experience, Special Issue: Euro-Par + 2009}, Vol.~23, pp.\ 187--198 (2011). \bibitem{gongo:2008a} 宮國 渡,河野真治,神里 晃,杉山千秋\:Cell 用の Fine-grain Task Manager の実装,情報処理学会 システムソフトウェアとオペレーティング・システム研究会 (2008). -\bibitem{spurs} -{Keisuke Inoue}: {SPU Centric Execution Model} (2006). - -\bibitem{cell} -{Sony Corporation}: {Cell broadband engine architecture} (2005). - \bibitem{chiaki} {Chiaki SUGIYAMA}: {SceneGraph と StatePattern を用いたゲームフレームワークの設計と実装} (2008). -\bibitem{blender} -: {Blender.jp - Blender Japanese Website}, \url{http://blender.jp/}. - -\bibitem{libspe2} -{International Business Machines Corporation, Sony Computer Entertainment - Incorporated, Toshiba Corporation}: {\em {SPE Runtime Management Library}} - (2006). - -\bibitem{kono} -{Shinji KONO}: {検証を自身で表現できるハードウェア、ソフトウェア記述言語 - Continuation ba sed C と、その Cell - への応用},{電子情報通信学会VLSI設計技術研究会} (2008). - -\bibitem{mailbox} -{Sony Corporation}: {Cell BroadbandEngine アーキテクチャ} (2006). +\bibitem{yutaka:os} + 金城裕,河野真治,多賀野海人,小林佑亮(琉球大学)\:ゲームフレームワークCerium + TaskManagerの改良,情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS) + (2011). \bibitem{toma:2012a} 當眞大千,河野真治\:Cerium Task Manager @@ -67,9 +44,7 @@ \bibitem{opencl:ref} {Khronos OpenCL Working Group}: {\em {OpenCL 1.2 Reference Pages}} (2012). -\bibitem{yutaka:os} - 金城裕,河野真治,多賀野海人,小林佑亮(琉球大学)\:ゲームフレームワークCerium - TaskManagerの改良,情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS) - (2011). +\bibitem{cuda} +: {CUDA}, {https://developer.nvidia.com/category/zone/cuda-zone/}. \end{thebibliography}
--- a/sigos.bib Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.bib Tue Apr 22 14:35:47 2014 +0900 @@ -1,41 +1,36 @@ - -@misc{osmesa, -author = "", -title = "{The Mesa 3D Graphics Library}", -howpublished = "\url{http://www.mesa3d.org/}" +@article{FFTonGPU, + author = "{Yasuhiko OGATA, Toshio Endo, Naoya MARUYAMA, Satoshi MATSUOKA}", + title = "性能モデルに基づくCPU及びGPUを併用する効率的なFFTライブラリ", + journal = "情報処理学会論文誌 コンピューティングシステム", + month = "June", + year = 2008 } - -@misc{sdl, -author = "", -title = "{Simple DirectMedia Layer}", -howpublished = "\url{http://www.libsdl.org/}" + +@misc{cell, +author = "{Sony Corporation}", +title = "{Cell broadband engine architecture}", +year = 2005 } -@article{akira, -author = "{Akira KAMIZATO}", -title = "{Cell を用いたゲームフレームワークの提案}", -journal = "{琉球大学理工学研究科情報工学専攻 平成19年度学位論文}", -year = 2008 +@misc{cerium, +author = "", +title = "{SourceForge.JP: Cerium Rendering Engine}", +howpublished = "{https//sourceforge.jp/projects/cerium/}" } -@book{amdahl, -author = "{Brian Goetz, Tim Peierls, Joshua Bloch, Joseph Bowbeer, David Holmes, and Doug Lea}", -title = "{Java Concurrency in Prac-tice}", -publisher = "{Addison-Wesley Professional}", -year = "2005" -} - -@book{opencl:applied, -author = "{北山洋幸}", -title = "{OpenCL応用 メニーコアCPU \& GPGPU時代の並列処理}", -publisher = "{カットシステム}", -year = "2012" -} - -@misc{gongo, -author = "", -title = "{SourceForge.JP: Project Info - Cerium Rendering Engine}", -howpublished = "\url{https://sourceforge.jp/projects/cerium/}" +@Article{ AugThiNamWac11CCPE, +author = {C{\'e}dric Augonnet and Samuel Thibault and Raymond Namyst and Pierre-Andr{\'e} Wacrenier}, +title = {{StarPU: A Unified Platform for Task Scheduling on Heterogeneous Multicore Architectures}}, +journal = {Concurrency and Computation: Practice and Experience, Special Issue: Euro-Par 2009}, +volume = 23, +issue = 2, +pages = {187--198}, +year = 2011, +month = FEB, +publisher = {John Wiley & Sons, Ltd.}, +doi = {10.1002/cpe.1631}, +url = {http://hal.inria.fr/inria-00550877}, +keywords = {StarPU} } @article{gongo:2008a, @@ -46,50 +41,20 @@ year = 2008 } -@misc{spurs, -author = "{Keisuke Inoue}", -title = "{SPU Centric Execution Model}", -text = "SACSIS 2006", -year = 2006 -} - -@misc{cell, -author = "{Sony Corporation}", -title = "{Cell broadband engine architecture}", -year = 2005 -} - @journal{chiaki, author = "{Chiaki SUGIYAMA}", title = "{SceneGraph と StatePattern を用いたゲームフレームワークの設計と実装}", journal = "{琉球大学工学部情報工学科 平成19年度卒業論文}", year = 2008 } - -@misc{blender, -title = "{Blender.jp - Blender Japanese Website}", -howpublished = "\url{http://blender.jp/}" -} - -@manual{libspe2, -author = "{International Business Machines Corporation, Sony Computer Entertainment Incorporated, Toshiba Corporation}", -title = "{SPE Runtime Management Library}", -year = 2006 + +@article{yutaka:os, + author = "金城裕 and 河野真治 and 多賀野海人 and 小林佑亮(琉球大学)", + title = "ゲームフレームワークCerium TaskManagerの改良", + journal = "情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS)", + month = "April", + year = 2011 } - -@article{kono, -author = "{Shinji KONO}", -title = "{検証を自身で表現できるハードウェア、ソフトウェア記述言語 Continuation ba sed C と、その Cell への応用}", -journal = "{電子情報通信学会VLSI設計技術研究会}", -year = 2008 -} - -@manual{mailbox, -author = "{Sony Corporation}", -title = "{Cell BroadbandEngine アーキテクチャ}", -year = 2006 -} - @article{toma:2012a, author = "當眞 大千 and 河野 真治", title = "Cerium Task Manager におけるマルチコア上での並列実行機構の実装", @@ -110,10 +75,8 @@ year = 2012 } -@article{yutaka:os, - author = "金城裕 and 河野真治 and 多賀野海人 and 小林佑亮(琉球大学)", - title = "ゲームフレームワークCerium TaskManagerの改良", - journal = "情報処理学会システムソフトウェアとオペレーティング・システム研究会(OS)", - month = "April", - year = 2011 -} \ No newline at end of file +@misc{cuda, +title = "{CUDA}", +howpublished = "{https://developer.nvidia.com/category/zone/cuda-zone/}" +} +
--- a/sigos.blg Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.blg Tue Apr 22 14:35:47 2014 +0900 @@ -4,61 +4,57 @@ The style file: ipsjunsrt.bst Database file #1: sigos.bib Warning--entry type for "chiaki" isn't style-file defined ---line 62 of file sigos.bib -Warning--Missing required argument author in osmesa -Warning--Missing required argument author in sdl -Warning--there's no number and/or volumeakira -Warning--Missing required argument pages in akira -Warning--Missing required argument author in gongo +--line 44 of file sigos.bib +Warning--there's no number and/or volumeFFTonGPU +Warning--Missing required argument pages in FFTonGPU +Warning--Missing required argument author in cerium Warning--there's no number and/or volumegongo:2008a Warning--Missing required argument pages in gongo:2008a -Warning--Missing required argument author in blender -Warning--there's no number and/or volumekono -Warning--Missing required argument pages in kono -Warning--there's no number and/or volumetoma:2012a -Warning--Missing required argument pages in toma:2012a Warning--there's no number and/or volumeyutaka:os Warning--Missing required argument pages in yutaka:os -You've used 18 entries, +Warning--there's no number and/or volumetoma:2012a +Warning--Missing required argument pages in toma:2012a +Warning--Missing required argument author in cuda +You've used 11 entries, 2207 wiz_defined-function locations, - 599 strings with 6002 characters, -and the built_in function-call counts, 2505 in all, are: -= -- 142 -> -- 92 -< -- 0 -+ -- 39 -- -- 21 -* -- 142 -:= -- 367 -add.period$ -- 18 -call.type$ -- 18 + 581 strings with 5615 characters, +and the built_in function-call counts, 1884 in all, are: += -- 115 +> -- 78 +< -- 1 ++ -- 30 +- -- 19 +* -- 121 +:= -- 272 +add.period$ -- 11 +call.type$ -- 11 change.case$ -- 0 chr.to.int$ -- 0 -cite$ -- 32 -duplicate$ -- 172 -empty$ -- 304 -format.name$ -- 34 -if$ -- 585 +cite$ -- 21 +duplicate$ -- 125 +empty$ -- 198 +format.name$ -- 31 +if$ -- 437 int.to.chr$ -- 0 -int.to.str$ -- 18 -missing$ -- 7 -newline$ -- 57 -num.names$ -- 14 -pop$ -- 86 +int.to.str$ -- 11 +missing$ -- 5 +newline$ -- 36 +num.names$ -- 9 +pop$ -- 53 preamble$ -- 1 purify$ -- 0 quote$ -- 0 -skip$ -- 108 +skip$ -- 80 stack$ -- 0 -substring$ -- 0 -swap$ -- 4 +substring$ -- 32 +swap$ -- 12 text.length$ -- 11 text.prefix$ -- 0 top$ -- 0 type$ -- 0 -warning$ -- 14 -while$ -- 14 -width$ -- 20 -write$ -- 117 -is.kanji.str$ -- 68 -(There were 15 warnings) +warning$ -- 10 +while$ -- 12 +width$ -- 13 +write$ -- 74 +is.kanji.str$ -- 55 +(There were 11 warnings)
--- a/sigos.log Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.log Tue Apr 22 14:35:47 2014 +0900 @@ -1,4 +1,4 @@ -This is pTeX, Version 3.141592-p3.1.10 (utf8.euc) (Web2C 7.5.4) (format=platex 2011.8.15) 21 APR 2014 19:39 +This is pTeX, Version 3.141592-p3.1.10 (utf8.euc) (Web2C 7.5.4) (format=platex 2011.8.15) 22 APR 2014 14:34 **sigos.tex (./sigos.tex pLaTeX2e <2006/11/10>+0 (based on LaTeX2e <2003/12/01> patch level 0) @@ -174,24 +174,24 @@ LaTeX Font Info: Checking defaults for JT1/mc/m/n on input line 31. LaTeX Font Info: ... okay on input line 31. LaTeX Font Info: Font shape `JT1/mc/bx/n' in size <14.4> not available -(Font) Font shape `JT1/gt/m/n' tried instead on input line 86. +(Font) Font shape `JT1/gt/m/n' tried instead on input line 85. LaTeX Font Info: Font shape `JY1/mc/bx/n' in size <14.4> not available -(Font) Font shape `JY1/gt/m/n' tried instead on input line 86. +(Font) Font shape `JY1/gt/m/n' tried instead on input line 85. LaTeX Font Info: External font `cmex10' loaded for size -(Font) <10.95> on input line 86. +(Font) <10.95> on input line 85. LaTeX Font Info: External font `cmex10' loaded for size -(Font) <8> on input line 86. +(Font) <8> on input line 85. LaTeX Font Info: Font shape `JT1/mc/bx/n' in size <12> not available -(Font) Font shape `JT1/gt/m/n' tried instead on input line 86. +(Font) Font shape `JT1/gt/m/n' tried instead on input line 85. LaTeX Font Info: Font shape `JY1/mc/bx/n' in size <12> not available -(Font) Font shape `JY1/gt/m/n' tried instead on input line 86. +(Font) Font shape `JY1/gt/m/n' tried instead on input line 85. Class ipsjpapers Warning: \etitle is too wide. Break line(s) by \\ on input lin -e 86. +e 85. LaTeX Font Info: External font `cmex10' loaded for size -(Font) <7> on input line 86. +(Font) <7> on input line 85. (./introduction.tex) (./opencl.tex LaTeX Font Info: Font shape `JT1/mc/bx/n' in size <9> not available (Font) Font shape `JT1/gt/m/n' tried instead on input line 2. @@ -214,7 +214,7 @@ ) (./cerium.tex File: ./images/createTask.pdf Graphic file (type eps) <./images/createTask.pdf> -Overfull \hbox (0.70938pt too wide) in paragraph at lines 25--26 +Overfull \hbox (0.70938pt too wide) in paragraph at lines 26--27 [] [] @@ -242,22 +242,22 @@ LaTeX Font Info: Font shape `OML/cmr/m/n' in size <8> not available (Font) Font shape `OML/cmm/m/it' tried instead on input line 7. [3]) -Overfull \hbox (71.1005pt too wide) in paragraph at lines 51--51 +Overfull \hbox (71.1005pt too wide) in paragraph at lines 52--52 []\OT1/cmr/m/n/9 multiply [] -Overfull \hbox (17.26125pt too wide) in paragraph at lines 56--66 +Overfull \hbox (17.26125pt too wide) in paragraph at lines 57--67 [] [] (./source/multiply_task.cc) -Overfull \hbox (53.93672pt too wide) in paragraph at lines 74--74 +Overfull \hbox (53.93672pt too wide) in paragraph at lines 75--75 []\OT1/cmr/m/n/9 task [] (./source/multiply_task_dp.cc) -Overfull \hbox (70.3366pt too wide) in paragraph at lines 112--112 +Overfull \hbox (70.3366pt too wide) in paragraph at lines 113--113 []\OT1/cmr/m/n/9 example [] @@ -276,11 +276,12 @@ []\OT1/cmr/m/n/9 multiply(CUDA) [] -) (./benchmark.tex [5] +) (./benchmark.tex [5]) (./conclusion.tex) (./sigos.bbl [6] +Overfull \hbox (58.50209pt too wide) in paragraph at lines 48--49 +[]\OT1/cmr/m/n/9 : CUDA, https://developer.nvidia.com/category/zone/cuda- + [] -LaTeX Warning: `!h' float specifier changed to `!ht'. - -) (./conclusion.tex) (./sigos.bbl [6]) [7 +) [7 ] (./sigos.aux) @@ -288,12 +289,12 @@ ) Here is how much of TeX's memory you used: - 2808 strings out of 94681 - 37370 string characters out of 1169859 - 176801 words of memory out of 1500000 - 6049 multiletter control sequences out of 10000+50000 - 18309 words of font info for 70 fonts, out of 1200000 for 2000 + 2804 strings out of 94681 + 37342 string characters out of 1169859 + 170801 words of memory out of 1500000 + 6043 multiletter control sequences out of 10000+50000 + 18772 words of font info for 72 fonts, out of 1200000 for 2000 566 hyphenation exceptions out of 8191 33i,10n,68p,250b,1813s stack positions out of 5000i,500n,6000p,200000b,5000s -Output written on sigos.dvi (7 pages, 53664 bytes). +Output written on sigos.dvi (7 pages, 53760 bytes).
--- a/sigos.tex Mon Apr 21 22:16:31 2014 +0900 +++ b/sigos.tex Tue Apr 22 14:35:47 2014 +0900 @@ -36,8 +36,8 @@ \etitle{Supporting OpenCL, CUDA in Parallel programming framework Cerium} % 所属ラベルの定義 -\affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Infomation Engineering, Graduate School of Engineering and Science, University of the Ryukyus.} -\affilabel{2}{琉球大学工学部情報工学科\\Infomation Engineering, University of the Ryukyus.} +\affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Information Engineering, Graduate School of Engineering and Science, University of the Ryukyus.} +\affilabel{2}{琉球大学工学部情報工学科\\Information Engineering, University of the Ryukyus.} % 和文著者名 \author{ @@ -72,12 +72,12 @@ % 英文概要 \begin{eabstract} - We are develpping parallel programming framework Cerium, that is running on the PS3, Linux, Mac OS X and GPGPU. + We are developing parallel programming framework Cerium, that is running on the PS3, Linux, Mac OS X and GPGPU. As GPGPU support on Mac OS X, OpenCL or CUDA can be used in an API set. Data Parallel on GPUGPU is also working on CPUs. In Task Parallel, data transfer causes overhead. To resolve this, pipeline data transfer is used both on GPGPU and Many Cores. - OpenCL and CUDA have slightly different behaviour on Data Parallel and out of order task execution. + OpenCL and CUDA have slightly different behavior on Data Parallel and out of order task execution. In WordCount and FFT examples, we show the different and its analysis. \end{eabstract} @@ -99,9 +99,8 @@ %\nocite{opencl:applied} %\nocite{yutaka:os} \bibliographystyle{ipsjunsrt} -\bibliography{sigs} +\bibliography{sigos} %\bibliography{cerium,book} -%\input{bibliography} % 参考文献 \end{document}