Mercurial > hg > Papers > 2021 > anatofuz-master
view paper/chapter/04-interface.tex @ 105:20bb97e54d33
update
author | anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sat, 06 Feb 2021 12:39:12 +0900 |
parents | 46494d9aafb9 |
children | 0512c7f88417 |
line wrap: on
line source
\chapter{GearsOSのInterfaceの改良} GearsOSのモジュール化の仕組みであるInterfaceは、 GearsOSの中心的な機能である。 Interfaceの取り扱いには様々なメタ計算が含まれ、 このメタ計算はPerlスクリプトによって生成される。 InterfaceをGearsOSで使ったプログラミングをするにつれて、様々な不足している機能や、改善すべき点が見つかった。 またPerlスクリプトがInterfaceを適切に取り扱う為のAPIも必要となることが分かった。 本章では本研究で行ったGearsOSのInterfaceの改良について述べる。 \section{GearsOSのInterfaceの構文の改良\label{sec:newInterface}} GearsOSのInterfaceでは、 従来はDataGearとCodeGearを分離して記述していた。 CodeGearの入出力をDataGearとして列挙する必要があった。 CodeGearの入出力として\texttt{\_\_code()}の間に記述したDataGearの一覧と、Interface上部で記述したDataGearの集合が一致している必要がある。 ソースコード\ref{src:old-stack}はStackのInterfaceの例である。 \lstinputlisting[label=src:old-stack, caption=従来のStack Interface]{src/old-stack.h} 従来の分離している記法の場合、 このDataGearの宣言が一致していないケースが多々発生した。 またInterfaceの入力としてのDataGearではなく、 フィールド変数としてDataGearを使うプログラミングスタイルを取るケースも見られた。 GearsOSでは、 DataGearやフィールド変数をオブジェクトに格納したい場合、 Interface側ではなくImpl側に変数を保存する必要がある。 Interface側に記述してしまう原因は複数考えられる。 GearsOSのプログラミングスタイルに慣れていないことも考えられるが、構文によるところも考えられる。 CodeGearとDataGearはInterfaceの場合は密接な関係性にあるが、 分離して記述してしまうと「DataGearの集合」と「CodeGearの集合」を別個で捉えてしまう。 あくまでInterfaceで定義するCodeGearとDataGearはInterfaceのAPIである。 これをユーザーに強く意識させる必要がある。 golangにもInterfaceの機能が実装されている。 golangの場合はInterfaceは関数の宣言部分のみを記述するルールになっている。 変数名は含まれていても含まなくても問題ない。 \begin{lstlisting}[frame=lrbt,label=src:golang_interface,caption={golangのinterface宣言}] type geometry interface { area() float64 perim() float64 } \end{lstlisting} GearsOSのInterfaceは入力と出力のAPIを定義するものであるので、 golangのInterfaceのように、関数のAPIを並べて記述するほうが簡潔であると考えた。 改良したInterfaceの構文でStackを定義したものをソースコード\ref{src:stack}に示す。 \lstinputlisting[label=src:stack, caption=変更後のStack Interface]{src/stack.h} 従来のInterfaceでは\texttt{<Type, Impl>}キーワードが含まれていた。 これはジェネリクスの機能を意識して導入された構文である。 \texttt{Impl}キーワードは実装自身の型を示す型変換として使われていた。 しかし基本Interfaceの定義を行う際にGearsOSのシステム上、CodeGearの第一引数は\texttt{Impl}型のポインタが来る。 これはオブジェクト指向言語で言う\texttt{self}に相当するものであり、 自分自身のインスタンスを示すポインタである。 Implキーワードは共通して使用されるために、 宣言部分からは取り外し、デフォルトの型キーワードとして定義した。 \texttt{Type}キーワードは型変数としての利用を意識して導入されていたが、現在までのGearsOSの例題では導入されていなかった。 ジェネリクスとしての型変数の利用の場合は\texttt{T}などの1文字変数がよく使われる。 変更後の構文ではのちのジェネリクス導入のことを踏まえて、\texttt{Type}キーワードは削除した。 構文を変更するには、 GearsOSのビルドシステム上でInterfaceを利用している箇所を修正する必要がある。 Interfaceはgenerate\_stub.plで読み込まれ、 CodeGearと入出力のDataGearの数え上げが行われる。 この処理はInterfaceのパースに相当するものである。 パース対象のInterfaceの構文は、変更前の構文にしか対応していなかった。 後方互換性を維持したまま、新しい構文に対応させるために、generate\_stub.plが利用するInterfaceの解析ルーチンを両方の構文に対応させた。 \section{Implementの型定義ファイルの導入}\label{sec:implType} Interfaceを使う言語では、 Interfaceが決まるとこれを実装するクラスや型が生まれる。 GearsOSもInterfaceに対応する実装が存在する。 例えばStack Interfaceの実装はSingleLinkedStackであり、 Queueの実装はSingleLinkedQueueやSynchronizedQueueが存在する。 このSynchronizedQueueはGearsOSではDataGearとして扱われる。 Interfaceの定義と同等な型定義ファイルが、 実装の型については存在しなかった。 従来はcontext.hのDataGearの宣言部分に、構造体の形式で表現したものを手で記述していた。(ソースコード\ref{src:singleContext.h}) \lstinputlisting[label=src:singleContext.h, caption=cotnext.hに直接書かれた型定義]{src/singleContext.h} CbCファイルからはcontext.hをインクルードすることで問題なく型の使用は可能である。 Perlのトランスパイラであるgenerate\_stub.plはInterfaceの型定義ファイルをパースしていた。 しかし型定義ファイルの存在の有無がInterfaceと実装で異なっている為に、 generate\_stub.plでImplementの型に関する操作ができない。 Implementの型も同様に定義ファイルを作製すれば、generate\_stub.plで型定義を用いた様々な処理が可能となり、ビルドシステムが柔軟な挙動が可能となる。 また型定義は一貫して\texttt{*.h}に記述すれば良くなるため、 プログラマの見通しも良くなる。 本研究では新たにImplementの型定義ファイルを考案する。 GearsOSではすでにInterfaceの型定義ファイルを持っている。 Implementの型定義ファイルも、 Interfaceの型定義ファイルと似たシンタックスにしたい。 Implementの型定義ファイルで持たなければいけないのは、 どのInterfaceを実装しているかの情報である。 この情報は他言語ではInterfaceの実装を持つ型の宣言時に記述するケースと、型名の記述はせずに言語システムが実装しているかどうかを確認するケースが存在する。 Javaでは\texttt{implements}キーワードを用いてどのInterfaceを実装しているかを記述する。\cite{javaimpl} ソースコード\ref{src:javaimpl}では、\texttt{Pig}クラスは\texttt{Animal} Interfaceを実装している。 \lstinputlisting[label=src:javaimpl, caption=JavaのImplementキーワード]{src/java-interface-implements.java} golangではInterfaceの実装は特にキーワードを指定せずに、 そのInterfaceで定義しているメソッドを、Implementに相当する構造体がすべて実装しているかどうかでチェックされる。 これはgolangはクラスを持たず、構造体を使ってInterfaceの実装を行う為に、 構造体の定義にどのInterfaceの実装であるかの情報をシンタックス上書けない為である。 GearsOSでは型定義ファイルを持つことができるために、 golangのような実行時チェックは行わず、 Javaに近い形で表現したい。 導入した型定義でSynchronizedQueueを定義したものをソースコード\ref{src:syncqueue}に示す。 大まかな定義方法はInterface定義のものと同様である。 違いとして\texttt{impl}キーワードを導入した。 これはJavaの\texttt{implements}に相当する機能であり、 実装したInterfaceの名前を記述する。 現状のGearsOSではImplが持てるInterfaceは1つのみであるため、\texttt{impl}の後ろにはただ1つの型が書かれる。 型定義の中では独自に定義したCodeGearを書いてもいい。 これはJavaのプライベートメソッドに相当するものである。 特にプライベートメソッドがない場合は、 実装側で所持したい変数定義を記述する。 SynchronizedQueueの例では\texttt{top}などが実装側で所持している変数である。 \lstinputlisting[label=src:syncqueue, caption=SynchronizedQueueの定義ファイル]{src/SynchronizedQueue.h} 従来context.hに直接記述していたすべてのDataGearの定義は、 スクリプトで機械的にInterfaceおよびImplementの型定義ファイルに変換を行った。 context.hからInterfaceおよびImplementの型定義をファイルに分割することができた。 しかしGearsOSのContextはすべてのDataGearの型定義を持つ必要がある。 この為、context.hには分割した型定義ファイルをもとに、CbCのメタレベルに変換された型情報を書き込む必要がある。 この処理はgenerate\_context.pl内でビルド時に行うようにした。 \section{Implementの型をいれたことによる間違ったGearsプログラミング} Implementの型を導入したが、 GearsOSのプログラミングをするにつれていくつかの間違ったパターンがあることがわかった。 自動生成されるStubCodeGearは、 goto metaから遷移するのが前提であるため、 引数をContextから取り出す必要がある。 Contextから取り出す場合は、 実装しているInterfaceに対応している置き場所からデータを取り出す。 この置き場所は\texttt{data}配列であり、 配列の添え字は\texttt{enum Data}と対応している。 また各CodeGearからgotoする際に、 遷移先のInterfaceに値を書き込みに行く。 ImplementのCodeGearから内部でgotoするCodeGearの場合は引数としてImpl内部のデータ型は取り出すことができない。 GearsOSではgoto文は、すべて\texttt{goto meta}に書き変わる。 goto metaが発行されるとStub Code Gearに継続するが、現在のシステムではInterfaceから値をStubで取得する。 Implementの内部の引数はこの時点ではStubから取得することはできず、 実装側のCodeGearの内部から取り出す必要がある。 StubからImpl内部のデータを取得しようと、 ImplをInterfaceと見立ててGearsOSのプログラミングをしたことがあった。 ソースコード\ref{src:fsImpl}では、fs Interfaceに対する実装のfs\_implを、 あたかもInterfaceのように見せるハックである。 generate\_stub.plはコンストラクタがあり、\texttt{\#interface}構文で呼ばれていたら、対象のDataGearがInterfaceであると判断する。 この場合はコンストラクタに対応する文字列をコメントとして書いている為、StubCodeGearはImplをInterfaceだと思い込む。 よって、 StubでContext内部のImplの置き場所から値を取得するようになった。 しかし、この誤魔化しはメタレベルとノーマルレベルの分離どころではなく、GearsOSの設計に反する記述であった。 \lstinputlisting[label=src:fsImpl, caption=ImplをInterfaceのようにふるまわせる為に、コンストラクタを偽装した例]{src/fsImpl.cbc} これはそもそも、Implの内部で持つ値はDataGearではなく、DataGearに含まれる値であるということを意識出来なかった為である。 GearsOSはデータの単位はDataGearで行われる。 Interfaceの呼び出し時に使われる引数はDataGearとして処理されるが、ImplはそもそもImpl全体が1つのDataGearであるため、Stub経由で値をとるのは間違っていたのであった。 Implの値をCodeGearの内部で使う場合は、第一引数で与えられる自分自身のDataGearの参照から取り出す必要がある。 \section{Interfaceのパーサーの構築}\label{sec:interfaceParser} 従来のGearsOSのトランスパイラでは、 generate\_stub.plがInterfaceファイルを開き、情報を解析していた。 この情報解析はgetDataGear関数で行われていた。 しかしこの関数は、CbCファイルのCodeGear、DataGearの解析で使用するルーチンと同じものである。 この為Interface特有のパースが出来ていなかった。 また、開いたヘッダファイルがInterfaceのファイルでも、そうでないCのヘッダファイルでも同様の解析をしてしまう。 Interfaceの定義ファイルの構文はすでに統一されたものを使用している。 Interfaceの定義の構文で実装されていないInterfaceファイルを読み込んだ場合は、 エラーとして処理したい。 また、Interfaceが満たすべきCodeGearの種類やInputDataGearの数の管理も行いたい。 さらにInterfaceではなく、Implementの定義ファイルも同様にパースし、情報を解析したい。 これらを実現するには、今までgenerate\_stub.plで使っていた情報解析ルーチンをもとに、最初からInterfaceに特化したパーサーが必要となる。 本研究ではGears::InterfaceモジュールとしてInterfaceのパーサーを実装した。 \subsection{Gears::Interfaceの構成} Gears::InterfaceはPerlのモジュールであるが、 実際はパーサー用のAPIを提供しているサブルーチンのまとまりである。 その為オブジェクトを作らずに直接メソッドを呼び出して利用する。 Gears::Interfaceは2種類のAPIを提供している。 \subsection{パースAPI} 1つは\texttt{parse}メソッドである。これはパースしたいファイル名を与えると、Interfaceであった場合にヘッダファイルをパースして情報を返すAPIである。 parseAPIでStack Interfaceをパースした結果の値をソースコード\ref{src:parsedStack1}に示す。 これはPerlの連想配列のリファレンスで表現されている。 \lstinputlisting[label=src:parsedStack1, caption=parseAPIでパースしたStack Interface]{src/parsedStack1.pl} contentが持つ要素は配列であり、 これはInterfaceをCbCの構造体に変換した際の内容である。 file\_nameにはパースしたファイルのパスが入る。 inner\_code\_gearsは、 Interfaceが継続として受け取るCodeGearの集合が入っている。 StackではnextとwhenEmptyは入力で受け取るため、 inner\_code\_gearsに格納されている。 nameはファイルパスではなく、 Interfaceの名前が格納されている。 ImplファイルであるSingleLinkedStack.hをパースした結果をソースコード\ref{src:parsedSingleStack}に示す。 \lstinputlisting[label=src:parsedSingleStack, caption=parseAPIでパースしたSingleLinkedStack]{src/parsedSingleLinkedStack.pl} ほとんど返す値はInterfaceの時のものと同様であるが、 Implの場合はisaキーに、実装しているInterfaceの名前が格納される。 この情報はパース対象がInterface、もしくはImplementでなければ返さない。 パーサーはInterfaceであるかどうかを、構文の正規表現にマッチするかどうかで確認をする。(ソースコード\ref{src:IsInterface}) \lstinputlisting[label=src:IsInterface, caption=Interfaceであるかどうかの確認]{src/IsInterface.pm} \subsection{詳細なパースAPI} parse APIはシンプルな結果を返していたが、 Interfaceに定義しているCodeGearの引数など、詳細な情報を取得したいケースがある。 Gears::Interfaceに、詳細なパース用のAPIである\texttt{detailed\_parse} APIを用意した。 先ほどのStack Interfaceをパースした結果をソースコード\ref{src:parsedStackDetail}に示す。 新たな情報としてcodeNameが連想配列の要素に追加されている。(ソースコード2行目) codeNameはCodeGearの名前がキーになっており、valueとして引数の文字列情報が\texttt{args}に、、 Interfaceの呼び出し時に必要な引数の個数が\texttt{argc}に設定される。 これらの情報は配列codesからもアクセス可能となっている。(ソースコード48行目) Interfaceが持つDataGearの一覧は、配列dataに格納される。(ソースコード62行目) OutputDataGearがあるCodeGearの一覧が、 hasOutputArgsに格納される。(ソースコード68行目) codeNameと同様に、CodeGearの名前がキーとなっている。 対応する値は、 出力する変数の名前と、その型の組のリストになっている。 この詳細なパースの結果は、以下に例を示す用途で使われる。 \begin{itemize} \item implementのCodeGearの名前の保管 \item InterfaceのCodeGearの定義と実装の対応の確認 \item OutputDataGearがあるAPI呼び出しであるかの確認 \item API呼び出し時の引数のチェック \end{itemize} \lstinputlisting[label=src:parsedStackDetail, caption=Stack Interfaceの詳細なパース]{src/StackParseDetail.pl} \subsection{Interfaceパーサーの呼び出し} 定義したパーサーは都度呼ぶこともできるが、ヘッダファイルのパスを入力で与える必要がある。 generate\_stub.plは実行時のコマンドライン引数としてヘッダファイルは与えられないので、スクリプト中で探索する必要がある。 毎回パースしたいInterface名の探索をするのは煩雑である。 基本的にgenerate\_stub.plではInterfaceの名前がすでに判明しており、そのInterfaceのパースした結果を取得したいのがほとんどである。 ここからスクリプト内部で、 Interfaceの名前とパースした結果を対応させる連想配列を実装した。 generate\_stub.plでは、スクリプト起動時に連想配列を変換処理を行う前に作製する。 ソースコード\ref{src:createHeaderName2Info}のサブルーチンが連想配列を作り出す処理である。 このサブルーチンでは、ヘッダファイルを起動時に全探査し、 すべてパースを行う。 4行目でGears::UtilのAPI呼び出しをしているが、 このAPIはGearsOSで使うヘッダファイルを、指定されたパスから再帰的に探索するものである。 なお同名のヘッダファイルが見つかった場合は、 変換をしているCbCファイルと同じディレクトリにあるヘッダファイルが優先される。(ソースコード 13行目) \lstinputlisting[label=src:createHeaderName2Info, caption=ヘッダファイルの名前とInterfaceのパース結果の対応リストの作製]{src/createHeaderName2Info.pl} \section{Interfaceの実装のCbCファイルへの構文の導入} \label{sec:newInterfaceInCbC} 今までのGearsOSではマクロに似た\texttt{\#interface}構文で使用するInterfce名を指定した。 しかしInterfaceを実装する場合も、 InterfaceのAPIを利用する際も同じシンタックスであった。 この2つは意味が異なっている為、 シンタックスを分離したい。 Implementの型定義ファイルを導入したので、Interfaceの実装をする場合に別のシンタックスを導入する。 導入された構文をソースコード\ref{src:implHeader}に示す。 この例ではStack Interfaceの実装としてSingleLinkedStackを定義する宣言である。 Implementの宣言の構文では、 まず\texttt{\#impl}の後ろに実装したいIntefaceの名前を入れる。 続く\texttt{as}キーワードの後ろに、 Implementの型名を記述する。 宣言はgenerate\_stub.plが読み取り、 変換した後のCbCファイルからは該当する行が削除される。 \lstinputlisting[label=src:implHeader, caption=Intefaceの実装をする際の宣言]{src/implHeader.h} \section{内部データ構造に利用するDataGearの使用構文の導入} \section{Interface APIに対応したCodeGearの名前の自動変換} \label{sec:autoCodeGearName} InterfaceのAPIに対応したCodeGearを実装する際、今までは暗黙にInterface名とImplの型名をつなげた名前で定義していた。 例えばStack InterfaceのAPIであるpopをSingleLinkedStackが実装した場合、CodeGearの名前はpopSingleLinkedStackにしていた。 CodeGearの名前につけられるImplの名前は、GearsOSのシステムがCodeGearの識別に使うメタな情報と言える。 ユーザーレベルではInterfaceのAPIと同じ名前のCodeGearを実装できると、GearsOSのメタなCodeGearの処理と分離可能である。 この為Perlスクリプトで、InterfaceのImplementの場合はCodeGearの名前を自動で変換する機能を実装した。 ここで変換するCodeGearの名前は、 CodeGearの定義部分と、継続で渡すCodeGearの名前の部分である。 generate\_stub.plはソースコードの情報を読み取るフェーズと、変換した情報を書き込むフェーズに別けられる。 まずは読み取りの際の処理をソースコード\ref{src:replaceCodeGearName1}に示す。 generate\_stub.plは、CodeGearの宣言時に、自分が今変換しているInterfaceのImplのCbCファイルかどうかをまず確認する。(ソースコード6行目) ImplのCbCファイルであった場合、変数\texttt{\$implInterfaceInfo}に具体的な値が入っているため、if文に進む。 if文の中ではInterfaceのパースの結果と、今定義しているCodeGearの名前を比較する。 ここでInterfaceのAPIであるCodeGearの名前と、今CbCファイルで定義しているCodeGearの名前が等しい場合、後ろに型名をつけたCodeGearの名前に変換し、スクリプト内で変換したことを記憶する。 \lstinputlisting[label=src:replaceCodeGearName1, caption=CodeGearの名前が等しいかどうかの確認]{src/replaceCodeGearName1.pl} CodeGearの宣言は、 Contextを引数に含めるようにすでに書き換えるルーチンで処理されていた。 この部分でCodeGearの名前を変更したい。 実際に書き出している処理の部分をソースコード\ref{src:replaceCodeGearName2}に示す。 この際に書き込むCodeGearの名前は、定義のCodeGear名を正規表現でキャプチャし、変数\texttt{\$currentCodeGearName}に代入している。(5行目) 読み込み時に作製した、名前の変更があることを保存する連想配列\texttt{\$replaceCodeGearNames}に、今書き込もうとしているCodeGearの名前を問い合わせる。 連想配列側にCodeGearの名前に対応する値があった場合は書き換え対象なので、 \texttt{\$currentCodeGearName}を、ソースコード\ref{src:replaceCodeGearName1}で作製したCodeGearの名前に変換する。 \lstinputlisting[label=src:replaceCodeGearName2, caption=CodeGearの名前の変更]{src/replaceCodeGearName2.pl} 実際に変換される様子を見る。 ソースコード\ref{src:pickupBefore}は、 Phils Interfaceの実装のソースコードの一部である。 Phils Interfaceにあるpickup\_lforkと、 eatingのCodeGearの定義をしている。 3行目ではcheckAndSetに継続として、 pickup\_rforkとeatingを渡している。 これらはそれぞれPhils Interfceに定義があるCodeGearの名前であり、 このファイル中で実装している。 \lstinputlisting[label=src:pickupBefore, caption=PhilsInterfaceの実装]{src/pickupBefore.cbc} 変換された結果をソースコード\ref{src:pickupAfter}に示す。 まずCodeGearの宣言時に名前の末尾に実装の型名であるPhilsImplがついている。 Gearefマクロに変換されている為見づらいが、 6行目、7行目でenumの定義に変換されてcontextに書き込まれているのが解る。 \lstinputlisting[label=src:pickupAfter, caption=変換されたPhilsInterfaceの実装]{src/pickupAfter.cbc} \section{GearsCbCのInterfaceの実装時の問題} Interfaceとそれを実装するImplの型が決定すると、最低限満たすべきCodeGearのAPIは一意に決定する。 ここで満たすべきCodeGearは、Interfaceで定義したCodeGearと、 Impl側で定義した privateなCodeGearとなる。 例えばStack Interfaceの実装を考えると、各Implで\texttt{pop}, push, shift, isEmptyなどを実装する必要がある。 従来はプログラマが手作業でヘッダーファイルの定義を参照しながら\texttt{.cbc}ファイルを作成していた。 手作業での実装のため、 コンパイル時に下記の問題点が多発した。 \begin{itemize} \item CodeGearの入力のフォーマットの不一致 \item Interfaceの実装のCodeGearの命名規則の不一致 \item 実装を忘れているCodeGearの発生 \end{itemize} 特にGearsOSの場合はPerlスクリプトによって純粋なCbCに一度変換されてからコンパイルが行われる。 実装の状況とトランスパイラの組み合わせによっては、 CbCコンパイラレベルでコンパイルエラーを発生させないケースがある。 この場合は実際に動作させながら、gdb, lldbなどのCデバッガを用いてデバッグをする必要がある。 またCbCコンパイラレベルで検知できても、すでに変換されたコード側でエラーが出る。 このため、 トランスパイラの挙動をトレースしながらデバッグをする必要がある。 Interfaceの実装が不十分であることのエラーは、 GearsOSレベル、最低でもCbCコンパイラのレベルで完全に検知したい。 \section{Interfaceを満たすコード生成の他言語の対応状況} Interfaceを機能として所持している言語の場合、Interfaceを完全に見たいしているかどうかはコンパイルレベルか実行時レベルで検知される。 例えばJavaの場合はInterfaceを満たしていない場合はコンパイルエラーになる。 InterfaceのAPIを完全に実装するのを促す仕組みとして、Interfaceの定義からエディタやツールが満たすべき関数と引数の組を自動生成するツールがある。 Javaでは様々な手法でこのツールを実装している。 Microsoftが提唱しているIDEとプログラミング言語のコンパイラをつなぐプロトコルにLanguage Serverがある。 Language Serverはコーディング中のソースコードをコンパイラ自身でパースし、 型推論やエラーの内容などをIDE側に通知するプロトコルである。 主要なJavaのLanguage Serverの実装であるeclipse.jdt.ls\cite{eclipse.jdt.ls}では、 LanguageServerの機能として未実装のメソッドを検知する機能が実装されている。\cite{eclipse_pull322} この機能を応用してvscode上から未実装のメソッドを特定し、 雛形を生成する機能がある。 他にもIntelliJ IDEなどの商用IDEでは、 IDEが独自に未実装のメソッドを検知、雛形を生成する機能を実装している。 golangの場合は主に\texttt{josharian/impl}\cite{golang_impl}が使われている。 これはインストールすると\texttt{impl}コマンドが使用可能になり、 実装したいInterfaceの型と、 Interfaceを実装するImplの型(レシーバ)を与えることで雛形が生成される。 主要なエディタであるvscodeのgolangの公式パッケージである\texttt{vscode-go}\cite{vscode-go}でも導入されており、 vscodeから呼び出すことが可能である。 vscode以外にもvimなどのエディタからの呼び出しや、 シェル上で呼び出して標準出力の結果を利用することが可能である。 \section{GearsOSでのInterfaceを満たすCbCの雛形生成} GearsOSでも同様のInterfaceの定義から実装するCodeGearの雛形を生成したい。 LanguageServerの導入も考えられるが、 今回の場合はC言語のLanguageServerをCbC用にまず改良し、 さらにGearsOS用に書き換える必要がある。 現状のGearsOSが持つシンタックスはCbCのシンタックスを拡張しているものではあるが、これはCbCコンパイラ側には組み込まれていない。 LanguageServerをGearsOSに対応する場合、 CbCコンパイラ側にGearsOSの拡張シンタックスを導入する必要がある。 CbCコンパイラ側への機能の実装は、 比較的難易度が高いと考えらる。 CbCコンパイラ側に手をつけず、 Interfaceの入出力の検査は既存のGearsOSのビルドシステム上に組み込みたい。 対してgolangの\texttt{impl}コマンドのように、 シェルから呼び出し標準出力に結果を書き込む形式も考えられる。 この場合は実装が比較的容易かつ、 コマンドを呼び出して標準出力の結果を使えるシェルやエディタなどの各プラットフォームで使用可能となる。 先行事例を参考に、コマンドを実行して雛形ファイルを生成するコマンド\texttt{impl2cbc.pl}をGearsOSに導入した。 \texttt{impl2cbc.pl}の処理の概要を図\ref{fig:impl2cbc}に示す。 impl2cbc.plでは、 実行時引数にImplementの型定義ファイルを与える。 impl2cbc.plの内部でImplementのパース結果からInterfaceを特定し、 雛形を生成する。 Interfaceの定義ファイルが複数見つかった場合、Implementの型定義ファイルがあるディレクトリと同じファイルが優先される。 コマンドラインからの呼び出しと、生成した結果をソースコードに示す。 \begin{figure}[hp] \begin{center} \includegraphics[width=130mm]{drawio/impl2cbc.pdf} \end{center} \caption{impl2cbcの処理の流れ} \label{fig:impl2cbc} \end{figure} \lstinputlisting[label=src:callimpl2cbc, caption=impl2cbcの実行方法]{src/callimpl2cbc.sh} \lstinputlisting[label=src:impl2cbcExecuted, caption=生成された雛形ファイル]{src/gneratedPhils.cbc} \subsection{雛形生成の手法} Interfaceでは入力の引数がImplと揃っている必要があるが、 第一引数は実装自身のインスタンスがくる制約となっている。 実装自身の型は、Interface定義時には不定である。 その為、 GearsOSではInterfaceのAPIの宣言時にデフォルト型変数\texttt{Impl}を実装の型として利用する。 デフォルト型\texttt{Impl}を各実装の型に置換することで自動生成が可能となる。 実装すべきCodeGearはInterfaceとImpl側の型を見れば定義されている。 \texttt{\_\_code}で宣言されているものを逐次生成すればよいが、 継続として呼び出されるCodeGearは具体的な実装を持たない。 GearsOSで使われているInterfaceには概ね次の継続である\texttt{next}が登録されている。 \texttt{next}そのものはInterfaceを呼び出す際に、入力として与える。 その為各Interfaceに入力として与えられた\texttt{next}を保存する場所は存在するが、 nextそのものの独自実装は各Interfaceは所持しない。 したがってこれをInterfaceの実装側で明示的に実装することはできない。 雛形生成の際に、入力として与えられるCodeGearを生成してしまうと、プログラマに混乱をもたらしてしまう。 入力として与えられているCodeGearは、Interfaceに定義されているCodeGearの引数として表現されている。 コードに示す例では、\texttt{whenEmpty}は入力して与えられているCodeGearである。 雛形を生成する場合は、入力として与えられたCodeGearを除外して出力を行う。 順序はInterfaceをまず出力した後に、 Impl側を出力する。 \subsection{コンストラクタの自動生成} 雛形生成では他にコンストラクタの生成も行う。 GearsOSのInterfaceのコンストラクタは、 メモリの確保及び各変数の初期化を行う。 メモリ上に確保するのは主にInterfaceとImplのそれぞれが基本となっている。 Interfaceによっては別のDataGearを内包しているものがある。 その場合は別のDataGearの初期化もコンストラクタ内で行う必要があるが、 自動生成コマンドではそこまでの解析は行わない。 コンストラクタのメンバ変数はデフォルトでは変数は0、ポインタの場合はNULLで初期化するように生成する。 このスクリプトで生成されたコンストラクタを使う場合、 CbCファイルから該当する部分を削除すると、\texttt{generate\_stub.pl}内でも自動的に生成される。 自動生成機能を作成すると1CbCファイルあたりの記述量が減る利点がある。 generate\_stub.pl内で作製する場合は、 すでにメタ情報を含むコードに書き換えたものを作製する。 その為厳密には同じコードを生成する訳ではない。 明示的にコンストラクタが書かれていた場合は、 Perlスクリプト内での自動生成は実行しないように実装した。 これはオブジェクト指向言語のオーバーライドに相当する機能と言える。 現状のGearsOSで使われているコンストラクタは、 基本は\texttt{struct Context*}型の変数のみを引数で要求している。 しかしオブジェクトを識別するためにIDを実装側に埋め込みたい場合など、 コンストラクタ経由で値を代入したいケースが存在する。 この場合はコンストラクタの引数を増やす必要や、 受け取った値をインスタンスのメンバに書き込む必要がある。 具体的にどの値を書き込めば良いのかまではPerlスクリプトでは判定することができない。 このような細かな調整をする場合は、 generate\_stub.pl側での自動生成はせずに、 雛形生成されたコンストラクタを変更すれば良い。 あくまで雛形生成スクリプトはプログラマ支援であるため、 いくつかの手動での実装は許容している。 \section{Interfaceの引数の数の確認} GearsOSのノーマルレベルでは、 InterfaceのAPIの呼び出しは\texttt{interface->method(arg)}の呼び出し方であった。 \texttt{arg}は引数であり、これはInterfaceで定義したAPIの引数の一致している必要がある。 Interfaceの定義の引数は、Implの実装自身が第一引数でくる制約があった。 この制約の為に、 厳密にはInterfaceの定義ファイルに書かれているCodeGearの引数と、Interfaceの呼び出しの引数は数が揃ってはいない。 generate\_stub.plは第一引数が実装自身の型であるので、union Data型にキャストし、Contextの引数保存場所に書き込むようになっている。 問題が第1引数以外の引数が揃っていない場合である。 generate\_stub.plを通すと、次の継続はgoto metaに変換されてしまい、引数情報が抜けてしまう。 その為引数はすべて適切にcontextに書き込まれている必要があるが、 一部引数が足りず書き込みが出来なかったケースでも、 CbCコンパイラレベルでは引数関係のエラーが発生しない。 また上手くInterfaceの入力の数を取得できなかった場合も、generate\_stub.plは止まらずにマクロを生成してしまう。 Gearefを通してcontextに書き込む右辺値が抜けているコードなどがよく発生した。 この場合は原因を.cファイルと.cbcファイル、Interfaceファイル、contextファイルのすべてを確認しなければならず、デバッグが非常に困難だった。 InterfaceのAPI呼び出し時の引数検知は、 Interfaceの型定義ファイルからCodeGearの入力の数の取得が不十分であるのが主な原因であった。 この問題はPerlスクリプトレベルで引数のチェックを十分に行う必要がある。 すでにInterfaceのパーサーは実装している為、 パーサー経由で呼び出しているAPIを持つInterfaceの情報を取得する。 パースした結果の情報に、 各CodeGearの引数情報と引数の数を取得できれば、それらとAPI呼び出し時に与えられている引数を比較すればチェックが可能である。 現状は引数の数が揃っているかどうかで確認をしている。 Intefaceの引数を確認し、Gearefマクロを生成しているgenerate\_stub.plの箇所に、引数の確認処理を実装した。(ソースコード\ref{src:parsedArgs}) ここでAPI呼び出し時の引数は、\texttt{\$tmpArgs}に代入されている。 CbCの関数呼び出しの引数はカンマで区切るので、2行目でカンマで文字列を分割し、引数を配列\texttt{@args}に変換している。 generate\_stub.plはローカル変数のすべての型を記録しているので、6行目でAPI呼び出しをしているインスタンスの名前からInterfaceを特定する。 特定後、ヘッダファイルの場所を取得し、8行目でInterfaceのパーサーを呼び出している。 パーサーから取得した情報から、メソッドの引数の数を14行目で取得し、 引数が格納されている配列\texttt{@args}の要素数と比較している。 \lstinputlisting[label=src:parsedArgs, caption=Perlレベルでの引数チェック]{src/parsedArgs.pl} Perlスクリプトでエラーを検知すると、 エラーで終了する。 ソースコード\ref{src:StackTestArg}のInterfaceの\texttt{insertTest1}を呼び出す例題でエラーを発生さる。 \lstinputlisting[label=src:StackTestArg, caption=StackTestInterfaceの定義]{src/StackTestArg.h} ソースコード\ref{src:StackTestArgCbC}でAPIを呼び出しているが、 この呼び出し方法では\texttt{stack}が引数にない。 \lstinputlisting[label=src:StackTestArgCbC, caption=StackTestInterfaceのAPI呼び出し(引数不足)]{src/StackTestArg.cbc} GearsOSのビルドを行うと、ソースコード\ref{src:argErr}のエラーが発生し、以降のビルドが停止する。 Cmakeはエラーを検知するとビルドを止めるようにMakefileを作製するため、 GearsOSの拡張構文のレベルで停止ができる。 \lstinputlisting[label=src:argErr, caption=InterfaceのAPI呼び出し時の引数エラー]{src/argError.txt} generate\_stub.pl側で、出てきたローカル変数と型の組はすべて保存している。 Interface側のCodeGearの定義にも当然引数の型と名前は書かれている。 このローカル変数の型と、CodeGearの定義の引数の型が、完全に一致しているかどうかのチェックを行うと、さらに強固な引数チェックが可能となる。 ただし引数で渡す際に、例えばint型の値の加算処理などを行っていると、その処理の結果がint型になっているかどうかをPerlレベルでチェックする必要が出てしまう。 \section{InterfaceのAPIにないものを呼び出した場合の検知} InterfaceAPI呼び出し時に、そもそもInterfaceファイルに定義していないAPIを呼び出してしまうことがある。 これもCbCファイルの変換前に処理を行いたい。 API呼び出し時の処理は、ソースコード\ref{src:parsedArgs}の処理そのものであるため、この処理の中に未実装のAPIを検知する様にした。 呼び出し元のInterfaceの情報パースした結果、ヘッダファイルにAPIの定義がなかった場合は11行目の\texttt{unless}に処理が落ち、 エラー終了する。 ソースコード\ref{src:NotFoundDefine.cbc}の例では、 Phils Interfaceに存在しないsleepingを呼び出している。 この状態でビルドを実行すると、ソースコード\ref{src:NotFoundDefine.sh}のエラーがMake時に発生し、ビルドが停止する。 \lstinputlisting[label=src:NotFoundDefine.cbc, caption=存在しないsleepingの呼び出し]{src/NotFoundDefine.cbc} \lstinputlisting[label=src:NotFoundDefine.sh, caption=存在しないAPIの呼び出し時のエラー]{src/NotFoundDefine.sh} \section{InterfaceのAPIを完全に実装していない場合の検知} InterfaceのAPIで定義したCodeGearは、Impl側はすべて実装している必要がある。 しかし、 CodeGearの実装を忘れてしまうケースがある。 これをPerlレベルで検知したい。 generate\_stub.plは2度CbCファイルを読み込む。 書き出しに移る前に、変換しようとしているCbCファイルのCodeGearの情報はすべて取得できている為に、ここで検知可能である。 初回のCbCファイルの読み込み終了時に、 検出できたCodeGearの名前と、CbCファイルが実装しようとしているInterfaceの定義を見比べる。 CodeGearをすべて満たしていなかった場合はエラーを出したい。 ソースコード\ref{src:notDefInterfaceAPI}は、Interfaceが要求しているAPIを実装したかを確認する部分である。 変換しようとしているCbCファイルが何かのInterfaceを実装しようとしている場合、 Interfaecの定義ファイルのパース結果から、満たすべきCodeGearの一覧を取得する。(ソースコード1、2行目) 実装していた場合は6行目でマークをつけ、 マークがなかったCodeGearが検知された時点でエラーを発生させる。(12行目) \lstinputlisting[label=src:notDefInterfaceAPI, caption=InterfaceのAPI呼び出し時の引数エラー]{src/NotDefine.pl} ソースコード\ref{src:errNotDef}の例では、Phils Interfaceの実装時にeating CodeGearの実装を忘れた際のエラーである。 CMakeがエラーを検知し、ビルドが停止するために、 GearsOSの拡張構文レベルでのエラー検知が実現できている。 \lstinputlisting[label=src:errNotDef, caption=未実装のInterfaceのAPIがあることを知らせるエラー]{src/errorNotDef.sh} \section{par goto のInterface経由の呼び出しの対応} 従来のpar gotoではInterface経由の呼び出しは想定していなかった。 par gotoで継続したいCodeGearはInterfaceのAPIとしてではなく、 Interfaceを入力として受け取るCodeGearとして実装する必要があった。 しかし食事する哲学者の問題(Dining Philosophers Problem、 DPP)の検証などでは、特定のInterfaceが並列で動いている必要がある。 例えばDPPの例題の場合は、哲学者(Philosopher)のInterfaceは並列で処理される必要がある。