comparison paper/chapter4.tex @ 33:417431560eed

benchmark data parallel
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Sun, 15 Feb 2015 11:59:06 +0900
parents 712576635154
children 7956856211c5
comparison
equal deleted inserted replaced
32:9b7ce931cad9 33:417431560eed
19 19
20 Cerium も DMA 転送を用いている箇所がある。 20 Cerium も DMA 転送を用いている箇所がある。
21 しかしマルチコア CPU 上で実行する場合は各 CPU で同じメモリ空間を利用できる。 21 しかしマルチコア CPU 上で実行する場合は各 CPU で同じメモリ空間を利用できる。
22 よって DMA 転送を用いていた部分をポインタ渡しを行うように修正し、 22 よって DMA 転送を用いていた部分をポインタ渡しを行うように修正し、
23 メモリに直接アクセスさせることで速度の向上が見込める。 23 メモリに直接アクセスさせることで速度の向上が見込める。
24
25 更に、DMA には prefetch 機能がある。
26 DMA の転送効率を向上させるため、 DMA で転送する送信データを予め取り込むことができる。
27 Cerium では DMA によるprefetch、DMA を用いないポインタ渡し、更に明示的なコピーによるデータ転送をサポートする。