Mercurial > hg > Papers > 2016 > masa-master
view slide/s6/index.html @ 101:cf5564c13205
fix
author | Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Thu, 18 Feb 2016 22:22:58 +0900 |
parents | 8857808cd8e8 |
children | 8223a72a80e5 |
line wrap: on
line source
<!DOCTYPE html> <html> <head> <meta charset='utf-8'> <title>sigos</title> <!-- Notes on CSS media types used: 1) projection -> slideshow mode (display one slide at-a-time; hide all others) 2) screen -> outline mode (display all slides-at-once on screen) 3) print -> print (and print preview) Note: toggle between projection/screen (that is, slideshow/outline) mode using t-key Questions, comments? - send them along to the mailinglist/forum online @ http://groups.google.com/group/webslideshow --> <!-- style sheet links --> <link rel="stylesheet/less" href="themes/blank/projection.css.less" media="screen,projection"> <link rel="stylesheet/less" href="themes/blank/screen.css.less" media="screen"> <link rel="stylesheet/less" href="themes/blank/print.css.less" media="print"> <link rel="stylesheet/less" href="themes/blank/blank.css.less" media="screen,projection"> <!-- Notes about less css support - all less stylesheets (*.css.less) need to get listed/loaded first (before the less.js script) - find more info about less.js online @ http://lesscss.org ***** NOTE: less.js browser script currently won’t work if you’re using Google Chrome and the path to your page starts with "file:///" due to a known Chrome issue. (In the developer/js console you will see: XMLHttpRequest cannot load file:///../s6/shared/projection.css.less. Cross origin requests are only supported for HTTP.) --> <!-- add js libs (less, jquery) --> <script src="js/less-1.1.4.min.js"></script> <script src="js/jquery-1.7.min.js"></script> <!-- S6 JS --> <script src="js/jquery.slideshow.js"></script> <script src="js/jquery.slideshow.counter.js"></script> <script src="js/jquery.slideshow.controls.js"></script> <script src="js/jquery.slideshow.footer.js"></script> <script src="js/jquery.slideshow.autoplay.js"></script> <script> $(document).ready( function() { Slideshow.init(); // Example 2: Start Off in Outline Mode // Slideshow.init( { mode: 'outline' } ); // Example 3: Use Custom Transition // Slideshow.transition = transitionScrollUp; // Slideshow.init(); // Example 4: Start Off in Autoplay Mode with Custom Transition // Slideshow.transition = transitionScrollUp; // Slideshow.init( { mode: 'autoplay' } ); } ); </script> <!-- Better Browser Banner for Microsoft Internet Explorer (IE) --> <!--[if IE]> <script src="js/jquery.microsoft.js"></script> <![endif]--> </head> <body> <div class="layout"> <div id="header"></div> <div id="footer"> <div align="right"> <img src="images/concurrency.png" width="200"> </div> </div> </div> <div class="presentation"> <!-- add slides here; example --> <div class='slide cover'> <table width="90%" height="90%" border="0" align="center"> <tr> <td><div align="center"> <h1><font color="#808db5">Cerium による文字列処理の並列処理</font></h1> </div></td> </tr> <tr> <td><div align="left"> Masataka Kohagura,Shinji Kono, <script> var date = new Date(); var year = date.getFullYear(); var month = date.getMonth(); var day = date.getDate(); var monthList = new Array("January","February","March","April","May","June", "July","August","September","October","November","December"); document.write(monthList[month]+" "+day+", "+year); </script> <hr style="color:#ffcc00;background-color:#ffcc00;text-align:left;border:none;width:300%;height:0.2em;"> </div></td> </tr> </table> </div> <!-- --> <div class='slide'> <h2>文字列処理の並列処理</h2> <p> 世界中のサーバには様々な情報や Log が保管されており、それらのテキストファイル全体のデータサイズを合計すると TB 単位ととても大きなサイズになると予想される。 </p> <p> それらの中から特定の文字列や正規表現によるパターンマッチングを探すなどの文字列処理には膨大な時間がかかる。 検索時間を短縮するためには、ファイルの読み込み時間を軽減し、プログラムの並列度をあげる必要がある。 </p> <p> Cerium は並列プログラミングフレームワークであり当研究室で開発している。本研究では、 </p> <p> <ul> <li> ファイル読み込みの改良 </li> <li> Cerium 上での文字列処理の並列処理の実装(Word Count、Boyer-Moore String Search、正規表現) </li> </ul> を行なった。 </p> <p> 文字列処理だけでなくファイルの読み込みまでを含む文字列処理を考慮した並列処理を実装し、処理全体の速度を上げるような実装を行なった。 </p> </div> <div class='slide'> <h2>Cerium Task Manager</h2> <ul> <li> Cerium は、本研究室で開発している並列プログラミングフレームワークで、C/C++ で実装されている。 </li> <li> Cerium は当初 Sony Computer Entertainment 社の PlayStation3 に搭載されいた Cell 向けに開発されていた。現在では Linux、MacOSX 上で動作する。 </li> <li> Cerium は当初 Sony Computer Entertainment 社の PlayStation3 に搭載されいた Cell 向けに開発されていた。現在では Linux、MacOSX 上で動作する。 </li> <li> 本研究では汎用計算フレームワークの TaskManager を利用して文字列処理の並列処理を実装した。 </li> </ul> </div> <div class='slide'> <h2>mmap の特徴</h2> これまで Cerium での文字列処理の例題では File 読み込みを mmap にて行なっていた。 <object data="images/cerium/mmap.svg" width="50%" type="image/svg+xml"></object><br> <br> <ul> <li> mmap は、仮想メモリ空間にファイルの中身を対応させ、そのメモリ空間に アクセスされたら、 OS が読み込みを行う。<br> </li> <li> code の記述はシンプルだが、スレッドが読み込み終わるまで待たされる。 <br> </li> <li> 読み込みが OS 依存となるので、環境に左右されやすく、読み込みを細かく制御することが難しい。 </li> </ul> </div> <div class='slide'> <h2>読み込みながら文字列処理を行う Blocked Read</h2> <p>mmap を使用せずに、読み込みを独立したスレッドで実行させる。そして、読み込んだ部分に対して Task を並列に起動する。 </p> <br> <object data="images/cerium/blockedread.svg" width="70%" type="image/svg+xml"></object><br> <br> <ul> <li> ファイルを一度に全て読み込むのではなく、ある程度の大きさに分けて読み込みを行う。</li> <li> 読み込みが終わったら文字列処理の Task を起動する。</li> <li> ファイルが読み込まれていない領域に対して文字列処理が行われないように依存関係を設定する。 </li> </ul> </div> <div class='slide'> <h2>I/O 専用 threadの追加</h2> <li> Blocked Read は読み込みを含む処理なので、処理時間が大きくなる。 </li> <li> Cerium では読み込みや文字列処理の Task に対してデバイスを設定することができる。SPE_ANY 設定を利用すると Cerium 側が自動的に割り振りを行う。 </li> <li> 自動的にデバイスを割り振ると、Blocked Read Task 間に Task が割り込まれる可能性があり、読み込みが遅延する恐れがある。 </li> <object data="images/cerium/speblockedread.svg" width="80%" type="image/svg+xml"></object><br> <li> デバイスの設定に I/O専用 thread の IO_0 を追加して、他の Task に割り込まれないようにした。 </li> <object data="images/cerium/iothread.svg" width="80%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>文字列処理の並列処理</h2> <object data="images/example/dividefile.svg" width="70%" type="image/svg+xml"></object><br> <li> ファイルをある程度の大きさに分割する。 </li> <li> 分割したファイルに対してそれぞれに文字列処理を行う。 </li> <li> 結果の集計後、Print Task にて結果を表示する。 </li> <li> ファイルの分割部分で結果の整合性が取れない場合がある。その場合は例題によって様々な方法をとって整合を取る。 </li> </div> <div class='slide'> <h2>Word Count</h2> <object data="images/example/wordcount.svg" width="70%" type="image/svg+xml"></object><br> <li> Word Count は読み込んだファイルの単語数を数える。 </li> <li> 改行が読み込まれたら行数のカウントを増やし、空白または改行が読み込まれたら単語数のカウントを増やす。 </li> <object data="images/example/wordcountseparate.svg" width="70%" type="image/svg+xml"></object><br> <li> 1つ目の分割されたファイルは空白または改行が 1 つしか無いため、単語数 1 となってしまっている。 </li> <li> ファイルの先頭の空白または改行の場合、単語数はカウントされない。 </li> <li> このように分割された場合、分割されたファイルの一つ目の末尾が文字で終わり、二つ目のファイルの先頭が改行または空白で始まった場合はそれぞれの単語数の合計数に1加えることにより整合性を取ることができる。 </li> </div> <div class='slide'> <h2>Boyer-Moore String Search</h2> <object data="images/example/bmsearchinclude.svg" width="50%" type="image/svg+xml"></object><br> <object data="images/example/bmsearchsame.svg" width="50%" type="image/svg+xml"></object><br> <object data="images/example/bmsearchthink.svg" width="50%" type="image/svg+xml"></object><br> <ul> <li>pattern に含まれていない文字で不一致した場合は、 pattern の長さだけ後ろにずらす。</li> <li>pattern に含まれている文字の場合は、pattern の長さから pattern に含まれている文字の位置を引いた数だけ後ろにずらす。</li> <li>pattern に含まれている文字でその文字が pattern に複数含まれている場合は後ろにずらす量も複数現れる。その中の最小の値だけ後ろにずらす。</li> </ul> </div> <div class='slide'> <h2>正規表現マッチャ(Cerium Grep)の実装</h2> <object data="images/regex/regexbasic.svg" width="50%" type="image/svg+xml"></object><br> <ul> <li>与えられた正規表現を構文解析し、正規表現木に変換する。</li> <li>正規表現木から非決定性オートマトン(以下、NFA)か決定性オートマトン(以下、DFA)に変換する。</li> <li>Subset Construction による NFA から DFA への変換をおこなう。</li> <li>DFA を元に文字列検索を行ない結果を返す。</li> </ul> </div> <div class='slide'> <h2>parser</h2> <object data="images/regex/parser.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>連接</h2> <object data="images/regex/regexseq.svg" width="50%" type="image/svg+xml"></object><br> <object data="images/regex/regexseq2.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>| の接続</h2> <object data="images/regex/regexselect.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>* の組み合わせ</h2> <object data="images/regex/regexasta.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2> | * の接続</h2> <object data="images/regex/regexgroup.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>正規表現の連接</h2> <object data="images/regex/regexseqregex.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>正規表現木をオートマトンの状態遷移に沿って状態割当</h2> <object data="images/regex/allostate.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>DFA</h2> <object data="images/regex/dfaregex.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>NFA</h2> <object data="images/regex/nfaex.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>1入力で複数の状態遷移先があれば、その状態をまとめる</h2> <object data="images/regex/nfa.svg" width="30%" type="image/svg+xml"></object><br> <object data="images/regex/dfa.svg" width="30%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>文字クラスの構造</h2> <pre> typedef struct utf8Range { unsigned long begin; unsigned long end; } RangeList , *RangeListPtr; typedef struct condition { RangeList range; } Condition, *ConditionList; typedef struct charClass { struct charClass *left; struct charClass *right; Condition cond; int stateNum; BitVector nextState; } CharClass, *CharClassPtr; </pre> </div> <div class='slide'> <h2>cc tree merge pattern</h2> <object data="images/regex/CharClassMergePattern.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>Subset Construction</h2> <object data="images/regex/sc.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>Bit Pattern での状態の表現</h2> </div> <div class='slide'> <h2>State Array</h2> <object data="images/regex/statearray.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>正規表現の整合性</h2> <object data="images/regex/regexdivide.svg" width="50%" type="image/svg+xml"></object><br> </div> <div class='slide'> <h2>実験概要</h2> <p>実験環境</p> <ul> <li>OS:MacOS 10.10.5</li> <li>CPU:2*2.66GHz 6-Core Intel Xeon</li> <li>HDD : 1TB 7200 rpm SATA 3.0 Gbps </li> </ul> </div> <div class='slide'> <h2>実験1:Word Count</h2> <ul> <li>FileSize : 500MB</li> <li>単語数 : 約8500万</li> <li>ファイル読み込みを含む時間</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>CPU Num\実行方式</td> <td></td> <td align=center>Mac(wc)</td> <td align=center>mmap</td> <td align=center>Blocked Read</td> </tr> <tr> <td align=right> 1</td> <td align=right></td> <td align=right>10.59</td> <td align=right>9.96</td> <td align=right>9.33</td> </tr> <tr> <td align=right>4</td> <td align=right></td> <td align=right>---</td> <td align=right>8.63</td> <td align=right>8.52</td> </tr> <tr> <td align=right>8</td> <td align=right></td> <td align=right>---</td> <td align=right>10.35</td> <td align=right>8.04</td> </tr> <tr> <td align=right>12</td> <td align=right></td> <td align=right>---</td> <td align=right>9.26</td> <td align=right>7.82</td> </tr> </tbody> </table> <ul> <li>FileSize : 500MB</li> <li>単語数 : 約8500万</li> <li>ファイル読み込みを含まない時間</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>実行方式</td> <td></td> <td align=center>実行速度(s)</td> </tr> <tr> <td align=right>Mac(wc)</td> <td align=right></td> <td align=right>4.08</td> </tr> <tr> <td align=right>Cerium Word Count(CPU 1)</td> <td align=right></td> <td align=right>3.70</td> </tr> <tr> <td align=right>Cerium Word Count(CPU 4)</td> <td align=right></td> <td align=right>1.00</td> </tr> <tr> <td align=right>Cerium Word Count(CPU 8)</td> <td align=right></td> <td align=right>0.52</td> </tr> <tr> <td align=right>Cerium Word Count(CPU 12)</td> <td align=right></td> <td align=right>0.40</td> </tr> </tbody> </table> </div> <div class='slide'> <h2>実験2 : Boyer-Moore String Search</h2> <ul> <li>FileSize : 500MB</li> <li>単語数 : 約8500万</li> <li>検索文字列 : Pakistan</li> <li>マッチ数 : 約400万</li> <li>ファイル読み込みを含まない</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>CPU Num\実行方式</td> <td></td> <td align=center>力任せ法</td> <td align=center>Boyer-Moore String Search</td> </tr> <tr> <td align=right> 1</td> <td align=right></td> <td align=right>3.17</td> <td align=right>1.70</td> </tr> <tr> <td align=right>4</td> <td align=right></td> <td align=right>0.87</td> <td align=right>0.49</td> </tr> <tr> <td align=right>8</td> <td align=right></td> <td align=right>0.47</td> <td align=right>0.27</td> </tr> <tr> <td align=right>12</td> <td align=right></td> <td align=right>0.33</td> <td align=right>0.21</td> </tr> </tbody> </table> </div> <div class='slide'> <h2>実験3:正規表現</h2> <ul> <li>FileSize : 500MB</li> <li>単語数 : 約8500万</li> <li>正規表現 : ‘[A-Z][A-Za-z0-9]*s’</li> <li>マッチ数 : 約536万</li> <li>ファイル読み込みの有無</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>実行方式</td> <td></td> <td align=center>ファイル読み込み有</td> <td align=center>ファイル読み込み無</td> </tr> <tr> <td align=right>single thread grep</td> <td align=right></td> <td align=right>21.17</td> <td align=right>16.15</td> </tr> <tr> <td align=right>CeriumGrep(CPU 12) mmap</td> <td align=right></td> <td align=right>18.00</td> <td align=right>5.12</td> </tr> <tr> <td align=right>CeriumGrep(CPU 12) bread</td> <td align=right></td> <td align=right>15.76</td> <td align=right>5.18</td> </tr> <tr> <td align=right>egrep</td> <td align=right></td> <td align=right>59.51</td> <td align=right>59.51</td> </tr> </tbody> </table> <ul> <li>ファイルサイズ : 500MB(約8500万単語)</li> <li>正規表現 : ‘[A-Z][A-Za-z0-9]*s’</li> <li>ファイルサイズを変更してみる</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>実行方式\ FileSize(Match Num)</td> <td></td> <td align=center>50MB(54万)</td> <td align=center>100MB(107万)</td> <td align=center>500MB(536万)</td> <td align=center>1GB(1072万)</td> </tr> <tr> <td align=right>single thread grep</td> <td align=right></td> <td align=right>4.51</td> <td align=right>9.42</td> <td align=right>20.62</td> <td align=right>40.10</td> </tr> <tr> <td align=right>CeriumGrep(CPU 12) mmap</td> <td align=right></td> <td align=right>8.97</td> <td align=right>10.79</td> <td align=right>18.00</td> <td align=right>29.16</td> </tr> <tr> <td align=right>CeriumGrep(CPU 12) bread</td> <td align=right></td> <td align=right>7.75</td> <td align=right>10.49</td> <td align=right>15.76</td> <td align=right>26.83</td> </tr> <tr> <td align=right>egrep</td> <td align=right></td> <td align=right>6.42</td> <td align=right>12.80</td> <td align=right>59.51</td> <td align=right>119.23</td> </tr> </tbody> </table> <ul> <li>ファイルサイズ : 500MB(約2400万単語)</li> <li>ファイル読み込みを含む</li> <li>正規表現の状態数を増やしてみる</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>正規表現</td> <td></td> <td align=center>状態数</td> <td align=center>subset後の状態数</td> <td align=center>マッチ数</td> <td align=center>CeriumGrep(CPU12) bread</td> <td align=center>egrep</td> </tr> <tr> <td align=left>’(a|b)*a(a|b)(a|b)z’</td> <td align=right></td> <td align=right>5</td> <td align=right>12</td> <td align=right>約10万</td> <td align=right>26.58</td> <td align=right>70.11</td> </tr> <tr> <td align=left>’(a|b)*a(a|b)(a|b)(a|b)z’</td> <td align=right></td> <td align=right>6</td> <td align=right>21</td> <td align=right>約8万</td> <td align=right>27.89</td> <td align=right>76.78</td> </tr> <tr> <td align=left>’(a|b)*a(a|b)(a|b)(a|b)(a|b)z’</td> <td align=right></td> <td align=right>7</td> <td align=right>38</td> <td align=right>約4万</td> <td align=right>28.86</td> <td align=right>81.88</td> </tr> <tr> <td align=left>’(a|b)*a(a|b)(a|b)(a|b)(a|b)(a|b)z’</td> <td align=right></td> <td align=right>8</td> <td align=right>71</td> <td align=right>約2万</td> <td align=right>29.15</td> <td align=right>86.93</td> </tr> </tbody> </table> <ul> <li>ファイルサイズ : 500MB(約2400万単語)</li> <li>正規表現 : (W|w)ork</li> <li>ab が並んでいるファイルに対して全くマッチングしない正規表現を与える</li> <li>ファイル読み込みを含む</li> </ul> <table border="2" cellpadding="0" cellspacing="0"> <tbody> <tr> <td align=center>実行方式</td> <td></td> <td align=center>time(s)</td> </tr> <tr> <td align=left>single thread grep</td> <td align=right></td> <td align=right>27.13</td> </tr> <tr> <td align=left>CeriumGrep(CPU12) mmap</td> <td align=right></td> <td align=right>21.58</td> </tr> <tr> <td align=left>CeriumGrep(CPU12) bread</td> <td align=right></td> <td align=right>19.99</td> </tr> <tr> <td align=left>egrep</td> <td align=right></td> <td align=right>28.33</td> </tr> </tbody> </table> </div> <div class='slide'> <h2>結論</h2> <ul> <li> I/O と Task を分離し、同時に動くように改良し、どの環境でも安定した速度が出た。 </li> <li> I/O 専用の Thread の追加 </li> <li> mmap でも一度に読み込む大きさを小さくすれば、Blocked Read とほぼ同じ速度が出る。 </li> </ul> <h2>今後の課題</h2> <ul> <li> Cerium の API として実装 </li> <li> 様々な実装の試み<br>(I/O threads を 2つ使用したプログラム、分割 mmap) </li> <li> 様々な環境での測定 </li> <li> grepの実装 </li> </ul> </div> <div class='slide'> <h2>状態をまとめる</h2> <object data="images/regex/wordstate.svg" type="image/svg+xml" width="50%"></object><br> </div> </div> <!-- presentation --> </body> </html>