Mercurial > hg > Papers > 2015 > yuhi-master
changeset 47:83d4c75a334a
update pdf
author | Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Mon, 16 Feb 2015 20:07:21 +0900 |
parents | da6fe9375077 |
children | 8d6a0f047d5a |
files | paper/abstract.tex paper/chapter6.tex paper/conclusion.tex paper/figures/multicore/data/sort/plot.sh paper/figures/multicore/data/sort/sort.eps paper/figures/multicore/sort.pdf paper/master_paper.pdf paper/master_paper.toc |
diffstat | 8 files changed, 137 insertions(+), 35 deletions(-) [+] |
line wrap: on
line diff
--- a/paper/abstract.tex Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/abstract.tex Mon Feb 16 20:07:21 2015 +0900 @@ -1,8 +1,9 @@ \begin{abstract} Cerium は並列プログラミングフレームワークである。 本来 Cerium は Cell Broad band Engine 用のフレームワークであったが、 -マルチコア CPU や GPU といったマルチプラットフォームに対応させ、 -より汎用的なフレームワークへ改良を行った。 +マルチコア CPU や GPU といったマルチプラットフォームに対応させ、より汎用的なフレームワークへ改良を行った。 + + マルチコア CPU は SynchronizedQueue 、 GPU は OpenCL と CUDA により実装した。 データ並列実行をサポートすることで GPGPU を行う際に高い並列度を維持することを可能にした。
--- a/paper/chapter6.tex Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/chapter6.tex Mon Feb 16 20:07:21 2015 +0900 @@ -87,7 +87,7 @@ その Task のデータ構造自体がメモリを消費してしまう。 そこである程度の量の Task を起動し、それが終了してから(正確には終了する前に)次の Task を生成するようになっている。 それらの機能を持った関数が6行目にあたる runTask である。 -run\_tasks に wait\_for による ReadTask との待ち合わせの処理を入れれば良い。 +runTask に wait\_for による ReadTask との待ち合わせの処理を入れれば良い。 BlockedRead の Task をいかに示す。
--- a/paper/conclusion.tex Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/conclusion.tex Mon Feb 16 20:07:21 2015 +0900 @@ -1,6 +1,4 @@ \chapter{結論} \label{chapter:conclusion} - -\section{まとめ} 本研究室で開発している Cerium を用いて、 マルチプラットフォーム対応並列プログラミングフレームワークに関する研究を行った。 @@ -10,9 +8,9 @@ 動作させたいプラットフォームに対応した、適切なチューニングを行えるフレームワークが必要である。 Cerium では Scheduler がパイプラインの機構を持っており、Task はパイプラインに沿って実行されている。 -Scheduler が受信した Task は既に TaskManager が依存関係を解決しているため、実行順序は任意で良く、パイプラインによる実行が可能となっている。 +Scheduler が受信した Task は既に TaskManager が依存関係を解決しているため、実行順序は任意で良い。 Cerium はプログラムの様々なレベルでパイプライン処理を行っており、 -WordCount のようなシンプルな問題でも並列化することで性能向上が確認できた。 +WordCount のようなシンプルな問題でも並列化することで性能向上する事が確認できた。 マルチコア CPU への対応として、 SynchronizedQueue を用いた機構を実装し、並列実行を可能にした。 WordCount と Sort による測定の結果、高い並列度を維持出来ていることを確認した。
--- a/paper/figures/multicore/data/sort/plot.sh Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/figures/multicore/data/sort/plot.sh Mon Feb 16 20:07:21 2015 +0900 @@ -12,7 +12,7 @@ # titleの設定 set title "Sort Benchmark" # x,yの範囲をどこからどこまでにするのか -set xrange [ 1 : 6 ] +set xrange [ 1 : 16 ] set yrange [ 0 : 2.1] # x,y軸のメモリを何ずつ刻むか set xtics 1
--- a/paper/figures/multicore/data/sort/sort.eps Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/figures/multicore/data/sort/sort.eps Mon Feb 16 20:07:21 2015 +0900 @@ -1,7 +1,7 @@ %!PS-Adobe-2.0 EPSF-2.0 %%Title: sort.eps %%Creator: gnuplot 4.2 patchlevel 6 -%%CreationDate: Tue Feb 10 12:04:56 2015 +%%CreationDate: Mon Feb 16 20:05:42 2015 %%DocumentFonts: (atend) %%BoundingBox: 50 50 410 302 %%EndComments @@ -48,7 +48,7 @@ /Author (yuhi) % /Producer (gnuplot) % /Keywords () - /CreationDate (Tue Feb 10 12:04:56 2015) + /CreationDate (Mon Feb 16 20:05:42 2015) /DOCINFO pdfmark end } ifelse @@ -690,13 +690,53 @@ ] -46.7 MCshow 1.000 UL LTb +1263 448 M +0 63 V +0 4109 R +0 -63 V +stroke +1263 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 2)] +] -46.7 MCshow +1.000 UL +LTb +1672 448 M +0 63 V +0 4109 R +0 -63 V +stroke +1672 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 3)] +] -46.7 MCshow +1.000 UL +LTb 2081 448 M 0 63 V 0 4109 R 0 -63 V stroke 2081 308 M -[ [(Helvetica) 140.0 0.0 true true 0 ( 2)] +[ [(Helvetica) 140.0 0.0 true true 0 ( 4)] +] -46.7 MCshow +1.000 UL +LTb +2490 448 M +0 63 V +0 4109 R +0 -63 V +stroke +2490 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 5)] +] -46.7 MCshow +1.000 UL +LTb +2899 448 M +0 63 V +0 4109 R +0 -63 V +stroke +2899 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 6)] ] -46.7 MCshow 1.000 UL LTb @@ -706,7 +746,27 @@ 0 -63 V stroke 3308 308 M -[ [(Helvetica) 140.0 0.0 true true 0 ( 3)] +[ [(Helvetica) 140.0 0.0 true true 0 ( 7)] +] -46.7 MCshow +1.000 UL +LTb +3717 448 M +0 63 V +0 4109 R +0 -63 V +stroke +3717 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 8)] +] -46.7 MCshow +1.000 UL +LTb +4127 448 M +0 63 V +0 4109 R +0 -63 V +stroke +4127 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 9)] ] -46.7 MCshow 1.000 UL LTb @@ -716,7 +776,27 @@ 0 -63 V stroke 4536 308 M -[ [(Helvetica) 140.0 0.0 true true 0 ( 4)] +[ [(Helvetica) 140.0 0.0 true true 0 ( 10)] +] -46.7 MCshow +1.000 UL +LTb +4945 448 M +0 63 V +0 4109 R +0 -63 V +stroke +4945 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 11)] +] -46.7 MCshow +1.000 UL +LTb +5354 448 M +0 63 V +0 4109 R +0 -63 V +stroke +5354 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 12)] ] -46.7 MCshow 1.000 UL LTb @@ -726,7 +806,27 @@ 0 -63 V stroke 5763 308 M -[ [(Helvetica) 140.0 0.0 true true 0 ( 5)] +[ [(Helvetica) 140.0 0.0 true true 0 ( 13)] +] -46.7 MCshow +1.000 UL +LTb +6172 448 M +0 63 V +0 4109 R +0 -63 V +stroke +6172 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 14)] +] -46.7 MCshow +1.000 UL +LTb +6581 448 M +0 63 V +0 4109 R +0 -63 V +stroke +6581 308 M +[ [(Helvetica) 140.0 0.0 true true 0 ( 15)] ] -46.7 MCshow 1.000 UL LTb @@ -736,7 +836,7 @@ 0 -63 V stroke 6990 308 M -[ [(Helvetica) 140.0 0.0 true true 0 ( 6)] +[ [(Helvetica) 140.0 0.0 true true 0 ( 16)] ] -46.7 MCshow 1.000 UL LTb @@ -776,11 +876,13 @@ 6423 4487 M 399 0 V 854 4565 M -2081 2524 L -3308 1847 L -4536 1502 L -5763 1303 L -6990 1177 L +1263 2524 L +409 -677 V +409 -345 V +409 -199 V +409 -126 V +3717 904 L +6990 854 L stroke LT1 /Helvetica findfont 140 scalefont setfont @@ -791,11 +893,13 @@ 6423 4347 M 399 0 V 854 2967 M -2081 1729 L -3308 1329 L -4536 1117 L -5763 1000 L -6990 932 L +1263 1729 L +409 -400 V +409 -212 V +409 -117 V +409 -68 V +818 -28 V +6990 854 L stroke LTb 854 4620 N
--- a/paper/master_paper.toc Mon Feb 16 19:25:02 2015 +0900 +++ b/paper/master_paper.toc Mon Feb 16 20:07:21 2015 +0900 @@ -30,13 +30,12 @@ \contentsline {section}{\numberline {8.2}マルチコア}{28} \contentsline {section}{\numberline {8.3}GPGPU}{30} \contentsline {section}{\numberline {8.4}並列 I/O}{32} -\contentsline {chapter}{\numberline {第9章}既存のプログラミングフレームワークとの比較}{35} -\contentsline {section}{\numberline {9.1}OpenCL}{35} -\contentsline {section}{\numberline {9.2}CUDA}{36} -\contentsline {section}{\numberline {9.3}StarPU}{37} -\contentsline {chapter}{\numberline {第10章}結論}{39} -\contentsline {section}{\numberline {10.1}まとめ}{39} -\contentsline {section}{\numberline {10.2}今後の課題}{40} -\contentsline {chapter}{謝辞}{41} -\contentsline {chapter}{参考文献}{42} -\contentsline {chapter}{発表文献}{43} +\contentsline {chapter}{\numberline {第9章}既存のプログラミングフレームワークとの比較}{34} +\contentsline {section}{\numberline {9.1}OpenCL}{34} +\contentsline {section}{\numberline {9.2}CUDA}{35} +\contentsline {section}{\numberline {9.3}StarPU}{36} +\contentsline {chapter}{\numberline {第10章}結論}{38} +\contentsline {section}{\numberline {10.1}今後の課題}{39} +\contentsline {chapter}{謝辞}{40} +\contentsline {chapter}{参考文献}{41} +\contentsline {chapter}{発表文献}{42}