Mercurial > hg > Papers > 2018 > tobaru-sigos
comparison Slide/prosym.md @ 4:c456e4d68e1a
add image file
author | tobaru |
---|---|
date | Sun, 20 May 2018 16:59:54 +0900 |
parents | 7f5c0330e711 |
children | 07b7aba92874 |
comparison
equal
deleted
inserted
replaced
3:7f5c0330e711 | 4:c456e4d68e1a |
---|---|
140 | 140 |
141 | 141 |
142 # Gears OS の評価 | 142 # Gears OS の評価 |
143 - CPU、GPU環境で Gears OS の測定を行う。 | 143 - CPU、GPU環境で Gears OS の測定を行う。 |
144 - 使用した環境は次のようになる。 | 144 - 使用した環境は次のようになる。 |
145 | 145 - CPU 環境 |
146 % 表2つ持ってくる | 146 - Model : Dell PowerEdgeR630 |
147 - Memory : 768GB | |
148 - CPU : 2 × 18-Core Intel Xeon 2.30GHz | |
149 - CPU 環境 | |
150 - GPU : GeForce GTX 1070 | |
151 - Cores : 1920 | |
152 - ClockSpeed : 1683MHZ | |
153 - Memory Size : 8GB GDDR5 | |
147 | 154 |
148 # Twice | 155 # Twice |
149 - 評価には与えられた整数配列の全ての要素を2倍にする例題である Twice を使う。 | 156 - 評価には与えられた整数配列の全ての要素を2倍にする例題である Twice を使う。 |
150 - Twice では 通信時間を考慮しなければ、CPU より コア数の多い GPU が有利となる。 | 157 - Twice では 通信時間を考慮しなければ、CPU より コア数の多い GPU が有利となる。 |
151 - 要素数2^27のデータに対する Twice の実行結果を示す。 | 158 - 要素数2^27のデータに対する Twice の実行結果を示す。 |
152 - CPU では2^27のデータを64個のデータに分割した。 | 159 - CPU では2^27のデータを64個のデータに分割した。 |
153 - kernel only は 通信速度を除いた速度である。 | 160 - kernel only は 通信速度を除いた速度である。 |
154 % グラフ2つ | 161 |
162 <table border="1" align='center' width='50%'> | |
163 <tbody> | |
164 <tr> | |
165 <td style="text-align: center;">Processor</td> | |
166 <td style="text-align: center;">Time(ms)</td> | |
167 </tr> | |
168 <tr> | |
169 <td style="text-align: center;">1 CPU</td> | |
170 <td style="text-align: right;">1181.215</td> | |
171 </tr> | |
172 <tr> | |
173 <td style="text-align: center;">2 CPUs</td> | |
174 <td style="text-align: right;">627.914</td> | |
175 </tr> | |
176 <tr> | |
177 <td style="text-align: center;">4 CPUs</td> | |
178 <td style="text-align: right;">324.059</td> | |
179 </tr> | |
180 <tr> | |
181 <td style="text-align: center;">8 CPUs</td> | |
182 <td style="text-align: right;">159.932</td> | |
183 </tr> | |
184 <tr> | |
185 <td style="text-align: center;">16 CPUs</td> | |
186 <td style="text-align: right;">85.518</td> | |
187 </tr> | |
188 <tr> | |
189 <td style="text-align: center;">32 CPUs</td> | |
190 <td style="text-align: right;">43.496</td> | |
191 </tr> | |
192 <tr> | |
193 <td style="text-align: center;">GPU</td> | |
194 <td style="text-align: right;">127.018</td> | |
195 </tr> | |
196 <tr> | |
197 <td style="text-align: center;">GPU(kernel only)</td> | |
198 <td style="text-align: right;">6.018</td> | |
199 </tr> | |
200 </tbody> | |
201 </table> | |
155 | 202 |
156 # 評価の考察 | 203 # 評価の考察 |
157 - コア数が上がるごとに、処理速度が上がっている。 | 204 - コア数が上がるごとに、処理速度が上がっている。 |
158 - GPUでの実行は 32CPU に比べて約7.2倍の速度向上が見られた。 | 205 - GPUでの実行は 32CPU に比べて約7.2倍の速度向上が見られた。 |
159 - 通信速度を含めると 16CPU より遅い。 | 206 - 通信速度を含めると 16CPU より遅い。 |
160 | 207 |
161 % なんでGo言語? | 208 % なんでGo言語? |
162 # Go 言語との比較 | 209 # Go 言語との比較 |
163 - Go 言語でも Twice を用いた検証を行い、Gears OS との速度比較を行なった。 | 210 - Go 言語でも Twice を用いた検証を行い、Gears OS との速度比較を行なった。 |
164 | |
165 % グラフ1つ | |
166 | |
167 # Go 言語との比較 | |
168 - 1CPU と 32CPU では約4.33倍の速度向上が見られた。 | 211 - 1CPU と 32CPU では約4.33倍の速度向上が見られた。 |
169 - CPU数による速度向上は、Gears OS の方が上だが、処理速度では Go言語の方が速い結果となった。 | 212 - CPU数による速度向上は、Gears OS の方が上だが、処理速度では Go言語の方が速い結果となった。 |
213 <div style="text-align: center;"> | |
214 <img src="./image/vsgo.svg" alt="message" width="500"> | |
215 </div> | |
216 | |
170 | 217 |
171 # スライドの流れ | 218 # スライドの流れ |
172 - CbC | 219 - CbC |
173 - Gears OS における並列実行 | 220 - Gears OS における並列実行 |
174 - 比較 | 221 - 比較 |