diff paper/chapter4.tex @ 33:417431560eed

benchmark data parallel
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Sun, 15 Feb 2015 11:59:06 +0900
parents 712576635154
children 7956856211c5
line wrap: on
line diff
--- a/paper/chapter4.tex	Sat Feb 14 15:50:18 2015 +0900
+++ b/paper/chapter4.tex	Sun Feb 15 11:59:06 2015 +0900
@@ -21,3 +21,7 @@
 しかしマルチコア CPU 上で実行する場合は各 CPU で同じメモリ空間を利用できる。
 よって DMA 転送を用いていた部分をポインタ渡しを行うように修正し、
 メモリに直接アクセスさせることで速度の向上が見込める。
+
+更に、DMA には prefetch 機能がある。
+DMA の転送効率を向上させるため、 DMA で転送する送信データを予め取り込むことができる。
+Cerium では DMA によるprefetch、DMA を用いないポインタ渡し、更に明示的なコピーによるデータ転送をサポートする。