Mercurial > hg > Papers > 2018 > nozomi-master
annotate paper/type.tex @ 43:9030d2680559
Wrote typed-lambda
author | atton <atton@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sun, 29 Jan 2017 12:27:25 +0900 |
parents | 142c8de4a24f |
children | 3b2446944d11 |
rev | line source |
---|---|
28 | 1 \chapter{ラムダ計算と型システム} |
2 \label{chapter:type} | |
3 \ref{chapter:cbc} では CbC のモデル検査的検証アプローチとして、akasha を用いた有限の要素数の挿入時の仕様の検証を行なった。 | |
4 しかし、さらに多くの要素を検証したり無限回の挿入を検証するには状態の抽象化や CbC 側に記号実行の機構を組み込んだり証明を行なう必要がある。 | |
5 CbC は直接自身を証明する機構が存在しない。 | |
6 プログラムの性質を証明するには CbC の形式的な定義が必須となる。 | |
7 \ref{chapter:type} 章ではCbC の項の形式的な定義の一つとして、部分型を用いて CbC の CodeSegment と DataSegment が定義できることを示していく。 | |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
8 また、型システムの別の利用方法として命題が型で表現できる Curry-Howard 対応を利用した証明が存在するが、その利用方法については\ref{chapter:agda}章で述べる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
9 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
10 % {{{ 型システムとは |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
11 \section{型システムとは} |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
12 型システムとは、計算する値を分類することにでプログラムがある種の振舞いを行なわないことを保証する機構の事である\cite{Pierce:2002:TPL:509043}\cite{pierce2013型システム入門プログラミング言語と型の理論}。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
13 ある種の振舞いとはプログラム中の評価不可能な式や、言語として未定義な式などが当て嵌まる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
14 例えば、gcc や clang といったコンパイラは関数定義時に指定された引数の型と呼び出し時の値の型が異なる時に警告を出す。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
15 % TODO: C の warning? |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
16 この警告は関数が受けつける範囲以外の値をプログラマが渡してしまった場合などに有効に働く。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
17 加えて、関数を定義する側も受け付ける値の範囲を限定できるため関数内部の処理を記述しやすい。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
18 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
19 型システムで行なえることには以下のようなものが存在する。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
20 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
21 \begin{itemize} |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
22 \item エラーの検出 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
23 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
24 文字列演算を行なう関数に整数を渡してしまったり、データの単位を間違えてしまったり、複雑な場合分けで境界条件を見落すなど、プログラマの不注意が型の不整合となって早期に指摘できる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
25 この指摘できる詳細さは、型システムの表現力とプログラムの内容に依存する。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
26 多用なデータ構造を扱うプログラム(コンパイラのような記号処理アプリケーションなど)は数値計算のような数種類の単純な型しか使わないプログラムよりも型検査器から受けられる恩恵が大きい。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
27 他にも、ある種のプログラムにとっては型は保守のためのツールともなる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
28 複雑なデータ構造を変更する時、その構造に関連するソースコードを型検査器は明らかにしてくれる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
29 |
31 | 30 \item 抽象化 |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
31 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
32 型は大規模プログラムの抽象化の単位にもなる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
33 例えば特定のデータ構造に対する処理をモジュール化し、パッケージングすることができる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
34 モジュール化されたデータ構造は厳格に定義されたインターフェースを経由して呼び出すことになる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
35 このインターフェースは利用する側に取っては呼び出しの規約となり、実装する側にとってはモジュールの要約となる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
36 |
31 | 37 \item ドキュメント化 |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
38 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
39 型はプログラムを理解する際にも有用である。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
40 関数やモジュールの型を確認することにより、どのデータを対象としているのかといった情報が手に入る。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
41 また、型はコンパイラが実行されるために検査されるため、コメントに埋め込まれた情報と異なり常に正しい情報を提供する。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
42 |
31 | 43 \item 言語の安全性 |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
44 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
45 安全性のの定義は言語によって異なるが、型はデータの抽象化によってある種の安全性を確保できる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
46 例えば、プログラマは配列をソートする関数があった場合、与えられた配列のみがソートされ、他のデータには影響が無いことを期待するだろう。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
47 しかし、低水準言語ではメモリを直接扱えるため、予想された処理の範囲を越えてデータを破壊する可能性がある。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
48 より安全な言語ではメモリアクセスが抽象化し、データを破壊する可能性をプログラマに提供しないという選択肢がある。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
49 |
31 | 50 \item 効率性 |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
51 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
52 そもそも、科学計算機における最初の型システムは Fortran などにおける式の区別であった。% TODO ref fortran |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
53 整数の算術式と実数の算術式を区別し、数値計算の効率化を測るために導入されたのである。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
54 型の導入により、コンパイラはプリミティブな演算とは異なる表現を用い、実行コードを生成する時に適切な機械語表現を行なえるようになった。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
55 昨今の高性能コンパイラでは最適化とコード生成のフェーズにおいて型検査器が収集する情報を多く利用している。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
56 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
57 \end{itemize} |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
58 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
59 型システムの定義には多くの定義が存在する。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
60 型の表現能力には単純型や総称型、部分型などが存在し、動的型付けや静的型付けなど、言語によってどの型システムを採用するかは言語の設計に依存する。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
61 例えば C言語では数値と文字を二項演算子 \verb/+/ で加算できるが、Haskell では加算することができない。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
62 これは Haskell が C言語よりも厳密な型システムを採用しているからである。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
63 具体的には Haskell は暗黙的な型変換を許さず、 C 言語は言語仕様として暗黙の型変換を持っている。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
64 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
65 型システムを定義することはプログラミング言語がどのような特徴を持つか決めることにも繋がる。 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
66 |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
67 % }}} |
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
68 |
38 | 69 % {{{ 型無し算術式 |
34 | 70 \section{型無し算術式} |
71 まず、型システムやその性質について述べるためにプログラミング言語そのものの基本的な性質について述べる。 | |
40 | 72 プログラムの構文と意味論、推論について考えるために自然数とブール値のみで構成される小さな言語を扱いながら考察する。 |
34 | 73 この言語は二種類の値しか持たないが、項の帰納的定義や証明、評価、実行時エラーのモデル化を表現することができる。 |
74 | |
75 この言語はブール定数 $ true $ と $ false $ 、条件式、数値定数 0 、算術演算子 $ succ $ と $ pred $ 、判定演算子 $ iszero $ のみからなる。 | |
76 算術演算子 $ succ $ は与えられた数の次の数を返し、 $ pred $ はその前の数を返す。 | |
77 判定演算子$ iszero $ は与えられた項が 0 なら $ true $ を返し、それ以外は $ false $ を返す。 | |
78 これらを文法として定義すると以下のリスト\ref{src:expr-term}のようになる。 | |
79 | |
80 \lstinputlisting[label=src:expr-term, caption=算術式の項定義] {src/expr-term.txt} | |
81 | |
82 この定義では算術式の項 $ t $ を定義している。 | |
83 $ ::= $ は項の集合の定義を表であり、$ t $ は項の変数のようなものである。 | |
84 それに続くすべての行は、構文の選択肢である。 | |
85 構文の選択肢内に存在する記号 $ t $ は任意の項を代入できることを表現している。 | |
86 このように再帰的に定義することにより、 \verb/ if (ifzero (succ 0)) then true else (pred (succ 0)) / といった項もこの定義に含まれる。 | |
87 例において、 $ succ $ 、 $ pred $ 、 $ iszero $ に複合的な引数を渡す場合は読みやすさのために括弧でくくっている。 | |
88 括弧の定義は項の定義には含んでいない。 | |
89 コンパイラなど具体的な字句をパースする必要がある場合、曖昧な構文を排除するために括弧の定義は必須である。 | |
90 しかし、今回は型システムに言及するために曖昧な構文は明示的に括弧で指示することで排除し、抽象的な構文のみを取り扱うこととする。 | |
91 | |
92 現在、項と式という用語は同一である。 | |
93 型のような別の構文表現を持つ計算体系においては式はあらゆる種類の構文を表す。 | |
94 項は計算の構文的表現という意味である。 | |
95 | |
96 この言語におけるプログラムとは上述の文法で与えられた形からなる項である。 | |
97 評価の結果は常にブール定数か自然数のどちらかになる。 | |
98 これら項は値と呼ばれ、項の評価順序の形式化において区別が必要となる。 | |
99 | |
100 なお、この項の定義においては \verb/succ true/ といった怪しい項の形成を許してしまう。 | |
101 実際、これらのプログラムは無意味なものであり、このような項表現を排除するために型システムを利用する。 | |
102 | |
103 ある言語の構文を定義する際に、他の表現かいくつか存在する。 | |
104 先程の定義は次の帰納的な定義のためのコンパクトな記法である。 | |
105 | |
106 \begin{definition} | |
107 項の集合とは以下の条件を満たす最小の集合 $ T $ である。 | |
108 \begin{eqnarray*} | |
109 \label{eq:expr} | |
110 \{true , false , 0\} \subseteq T \\ | |
111 t_1 \in T ならば \{succ \; t_1 , pred \; t_1 , iszero \; t_1\} \subseteq T \\ | |
112 t_1 \in T かつ t_2 \in T かつ t_3 \in T ならば if \; t_1 \; then \; t_2 else \; t_3 \subseteq T | |
113 \end{eqnarray*} | |
114 \end{definition} | |
115 | |
116 まず1つめの条件は、$ T $ に属する3つの式を挙げている。 | |
117 2つめと3つめの条件は、ある種の複合的な式が $ T $ に属することを判断するための規則を表している。 | |
118 最後の「最小」という単語は $ T $ がこの3つの条件によって要求される要素以外の要素を持たないことを表している。 | |
119 | |
120 また、項の帰納的表現の略記法として、二次元の推論規則形式を用いる方法もある。 | |
121 これは論理体系を自然演繹スタイルで表現するためによく使われる。 | |
122 自然演繹による証明は\ref{agda}章内で触れるが、今回は項表現として導入する。 | |
123 | |
124 \begin{definition} | |
36 | 125 項の集合は次の規則によって定義される。 |
126 | |
127 \begin{prooftree} | |
128 \AxiomC{$ true \in T $} | |
129 \end{prooftree} | |
130 | |
131 \begin{prooftree} | |
132 \AxiomC{$ false \in T $} | |
133 \end{prooftree} | |
134 | |
135 \begin{prooftree} | |
136 \AxiomC{$ 0 \in T $} | |
137 \end{prooftree} | |
138 | |
139 \begin{prooftree} | |
140 \AxiomC{$ t_1 \in T $} | |
141 \UnaryInfC{$ succ \; t_1 \in T$} | |
142 \end{prooftree} | |
143 | |
144 \begin{prooftree} | |
145 \AxiomC{$ t_1 \in T $} | |
146 \UnaryInfC{$ pred \; t_1 \in T$} | |
147 \end{prooftree} | |
148 | |
149 \begin{prooftree} | |
150 \AxiomC{$ t_1 \in T $} | |
151 \UnaryInfC{$ iszero \; t_1 \in T$} | |
152 \end{prooftree} | |
153 | |
154 \begin{prooftree} | |
155 \AxiomC{$ t_1 \in T $} | |
156 \AxiomC{$ t_2 \in T $} | |
157 \AxiomC{$ t_3 \in T $} | |
158 \TrinaryInfC{$ if \; t_1 \; then \; t_2 \; else \; t_3 \in T$} | |
159 \end{prooftree} | |
160 | |
34 | 161 \end{definition} |
162 | |
36 | 163 最初の$ true, \; false, \; 0 $の3つ規則は再帰的定義の1つめの条件と同じである。 |
164 それ以外の4つの規則は再帰的定義の2つめと3つめの条件と同じである。 | |
165 それぞれの規則は「もし線の上に列挙して前提が成立するのならば、線の下の結論を導出できる」と読む。 | |
166 $ T $ がこれらの規則を満たす最小の集合である事実は明示的に述べられない。 | |
167 | |
168 言語の構文は定義できたので、次は項がどう評価されるかの意味論について触れていく。 | |
169 意味論の形式化には操作的意味論や表示的意味論、公理的意味論やゲーム意味論などがあるが、ここでは操作的意味論について述べる。 | |
170 操作的意味論とは、言語の抽象機械を定義することにより言語の振舞いを規程する。 | |
171 この抽象機械が示す抽象とは、扱う命令がプロセッサの命令セットなどの具体的なものでないことを表している。 | |
172 単純な言語の抽象機械における状態は単なる項であり、機械の振舞いは遷移関数で定義される。 | |
173 この関数は各状態において項の単純化ステップを実行して次の状態を与えるか、機械を停止させる。 | |
174 ここで項 $ t $ の意味は、$ t $ を初期状態として動き始めた機械が達する最終状態である。 | |
175 | |
176 なお、一つの言語に複数の操作的意味論を与えることもある。 | |
177 例えば、プログラマが扱う項に似た機械状態を持つ意味論の他に、コンパイラの内部表現やインタプリタが扱う意味論を定義する。 | |
178 これらの振舞いが同じプログラムを実行した時に何かしらの意味であれば、結果としてその言語の実装の正しさを証明することに繋がる。 | |
179 | |
180 まずはブール式のみの操作的意味論を定義する。 | |
181 | |
182 \begin{definition} | |
37 | 183 ブール値(B) |
36 | 184 |
38 | 185 項 |
36 | 186 \begin{align*} |
187 t ::= && \text{項} \\ | |
188 true && \text{定数真} \\ | |
189 false && \text{定数偽} \\ | |
190 if \; t \; then \; t \; else \; t && \text{条件式} | |
191 \end{align*} | |
192 | |
193 値 | |
194 \begin{align*} | |
195 v ::= && \text{値} \\ | |
196 true && \text{真} \\ | |
197 false && \text{偽} | |
198 \end{align*} | |
199 | |
200 評価 | |
201 \begin{align*} | |
202 if \; true \; then \; t_2 \; else t_3 \rightarrow t_2 && \text{(E-IFTRUE)} \\ | |
203 if \; false \; then \; t_2 \; else t_3 \rightarrow t_3 && \text{(E-IFFALSE)} \\ | |
204 \AxiomC{$ t_1 \rightarrow t_1'$} | |
205 \UnaryInfC{$ if \; t_1 \; then \; t_2 \; else \; t_3 \rightarrow if \; t_1' \; then t_2 \; else \;t_3 $} | |
206 \DisplayProof | |
207 && \text{(E-IF)} | |
208 \end{align*} | |
37 | 209 |
210 \end{definition} | |
211 | |
212 評価の最終結果になりえる項である値は定数 $ true $ と $ false $ のみである。 | |
213 評価の定義は評価関係の定義である。 | |
214 評価関係 $ t \rightarrow t' $ は「$ t $ が1ステップで $ t' $ に評価される」と読む。 | |
215 直感的には抽象機械の状態が $ t $ ならば $ t' $ が手に入るという意味である。 | |
216 | |
217 評価関係は3つあるが、2つは前提を持たないため、2つの公理と1つの規則から成る。 | |
218 1つめの規則 E-IFTRUE の意味は、評価の対象となる項の条件式が定数 $ true $ である時に、then 節にある $ t_2 $ を残して他の全ての項を捨てるという意味である。 | |
219 E-EIFFALSE も同様に条件式が $ false $ の時に $ t_3 $ のみを残す。 | |
220 3つ目の規則 E-IF は条件式の評価である。 | |
221 条件式 $ t $ が $ t'$ に評価されうるのならば then 節と else 節を変えずに条件部のみを評価する。 | |
222 | |
223 評価の定義から分かることの中に、if の中の then節 と else 節は条件部より先に評価されないことがある。 | |
224 よって、この言語は条件式の評価に対し条件部から評価が優先されるという評価戦略を持つことが分かる。 | |
225 | |
226 \begin{definition} | |
227 推論規則のインスタンスとは、規則の結論や前提に対し、一貫して同じ項による書き換えを行なったものである。 | |
228 \end{definition} | |
229 | |
230 例えば、 | |
231 | |
232 \verb/if true then true else (if false then false else false)/ | |
233 | |
234 は E-IFTRUE のインスタンスであり、 E-IFTRUEの $ t_2 $ が \verb/true/ かつ $ t_3 $ が \verb/if false then false else false/ の時である。 | |
235 | |
236 \begin{definition} | |
237 1ステップ評価関係 $ \rightarrow $ とは、3つの評価の規則を満たす、項に関する最小の二項関係である。 | |
238 $ (t, \; t') $ がこの関係の元である時、「評価関係式 $ t \rightarrow t'$ は導出可能である」と言う。 | |
36 | 239 \end{definition} |
240 | |
37 | 241 ここで「最小」という言葉が表れるため、評価関係式 $ t \rightarrow t'$ が導出可能である時かつその時に限り、その関係式は規則によって正当化される。 |
242 すなわち評価関係式は公理 E-IFTRUE か E-IFFALSE 、前提が成り立つ時の E-IF のインスタンスとなる。 | |
243 与えられた評価関係式が導出可能であることを証明するには、葉が E-IFTRUE か E-IFFALSE であり、内部ノードのラベルが E-IF のインスタンスである導出木が示せれば良い。 | |
244 例えば以下の略記の元 $ if \; t \; then \; false \; then \; false \rightarrow if \; u \; then \; false \; else \; false $ の導出可能性は以下のような導出木によって示せる。 | |
36 | 245 |
37 | 246 \begin{itemize} |
247 \item $ s = if \; true \; then \; false \; else \; false $ | |
248 \item $ t = if \; s \; then \; true \; else \; true $ | |
249 \item $ u = if \; false \; then \; true \; else \; true $ | |
250 \end{itemize} | |
251 | |
252 | |
253 \begin{prooftree} | |
254 \AxiomC{} | |
255 \RightLabel{E-IFTRUE} | |
256 \UnaryInfC{ $ s \rightarrow true $ } | |
257 \RightLabel{E-IF} | |
258 \UnaryInfC{ $ t \rightarrow u $} | |
259 \RightLabel{E-IF} | |
260 \UnaryInfC{ $ if \; t \; then \; false \; then \; false/ \rightarrow if \; u \; then \; false \; else \; false $} | |
261 \end{prooftree} | |
262 | |
263 1ステップ評価関係は与えられた項に対して抽象機械の状態遷移を定義する。 | |
264 この時、機械がそれ以上ステップを進められない時にそれが最終結果となる。 | |
265 | |
266 \begin{definition} | |
267 正規形 | |
268 | |
269 項 $ t $ が正規形であるとは、$ t \rightarrow t'$となる評価規則が存在しないことである。 | |
270 \end{definition} | |
271 | |
272 この言語において $ true $ や $ false $ は正規形である。 | |
273 逆に言えば、構文的に正しい if が用いられている場合は評価することが可能なため正規形ではない。 | |
274 極端に言えばこの言語における全ての値は正規形なのである。 | |
275 しかし、他の言語における値は一般的に正規形ではない。 | |
276 実のところ、値でない正規形は実行時エラーとなって表れる。 | |
277 | |
40 | 278 実際にこの言語に自然数を導入し、値では無い正規形を確認していく。 |
34 | 279 |
280 | |
38 | 281 \begin{definition} |
282 算術式BN (B の拡張) の項 | |
283 \begin{align*} | |
284 t ::= && \text{項} \\ | |
285 true && \text{定数真} \\ | |
286 false && \text{定数偽} \\ | |
287 if \; t \; then \; t \; else \; t && \text{条件式} \\ | |
288 0 && \text{定数ゼロ} \\ | |
289 succ \; t && \text{後者値} \\ | |
290 pred \; t && \text{前者値} \\ | |
291 iszero \; t && \text{ゼロ判定} | |
292 \end{align*} | |
293 \end{definition} | |
294 | |
295 \begin{definition} | |
296 算術式BN の値 | |
297 \begin{align*} | |
298 v ::= && \text{値} \\ | |
299 true && \text{真} \\ | |
300 false && \text{偽} \\ | |
301 nv && \text{数値} \\ | |
302 \end{align*} | |
303 \end{definition} | |
304 | |
305 \begin{definition} | |
306 算術式BNの数値 | |
307 \begin{align*} | |
308 nv ::= && \text{数値} \\ | |
309 0 && \text{ゼロ} \\ | |
310 succ nv && \text{後者値} | |
311 \end{align*} | |
312 \end{definition} | |
313 | |
314 \begin{definition} | |
315 算術式BNの評価($ t \rightarrow t' $) | |
316 \begin{align*} | |
317 if \; true \; then \; t_2 \; else t_3 \rightarrow t_2 && \text{(E-IFTRUE)} \\ | |
318 if \; false \; then \; t_2 \; else t_3 \rightarrow t_3 && \text{(E-IFFALSE)} \\ | |
319 \AxiomC{$ t_1 \rightarrow t_1'$} | |
320 \UnaryInfC{$ if \; t_1 \; then \; t_2 \; else \; t_3 \rightarrow if \; t_1' \; then t_2 \; else \;t_3 $} | |
321 \DisplayProof && \text{(E-IF)} \\ | |
322 \AxiomC{$ pred \; 0 \rightarrow 0$} | |
323 \DisplayProof && \text{(E-PREDZERO)} \\ | |
324 \AxiomC{$ pred \; (succ \; nv_1) \rightarrow nv_1$} | |
325 \DisplayProof && \text{(E-PREDSUCC)} \\ | |
326 \AxiomC{$ t_1 \rightarrow t_1'$} | |
327 \UnaryInfC{$ pred \; t_1 \rightarrow pred \; t_1'$} | |
328 \DisplayProof && \text{(E-PRED)} \\ | |
329 \AxiomC{$ iszero \; 0 \rightarrow true$} | |
330 \DisplayProof && \text{(E-ISZEROZERO)} \\ | |
331 \AxiomC{$ iszero \; (succ \; nv_1) \rightarrow false$} | |
332 \DisplayProof && \text{(E-ISZEROSUCC)} \\ | |
333 \AxiomC{$ t_1 \rightarrow t_1'$} | |
334 \UnaryInfC{$ iszero \; t_1 \rightarrow iszero \; t_1'$} | |
335 \DisplayProof && \text{(E-ISZERO)} \\ | |
336 \end{align*} | |
337 \end{definition} | |
338 | |
339 今回値の定義に数値を表す構文要素が追加されている。 | |
340 数は0かある数に後者関数を適用したもののどちらかである。 | |
341 評価規則 E-PREDZERO、E-PREDSUCC、E-ISZEROZERO、E-ISZEROSUCC は演算 \verb/pred/ と \verb/iszero/ が数に適用された時にどう振る舞うかを定義している。 | |
342 E-SUCC 、 E-PRED 、 E-ISZERO の合同規則も E-IF のように部分項から先に評価することを示している。 | |
343 | |
344 数値の構文要素(nv)はこの定義によって重要な役割をはたす。 | |
345 例えば、 E-PREDSUCC 規則が適用できる項は任意の項 $ t $ ではなく数値 $nv_1$である。 | |
346 これは $ pred \; (succ \; (pred \; 0)) $ を $ pred 0 $ に評価できないことを意味する。 | |
347 なぜなら $ pred \; 0 $ は数値に含まれないからである。 | |
348 | |
349 ここで言語の操作的意味論について考える時、すべての項に関する振舞いを定義する必要がある。 | |
350 すべての項には $ pred \; 0 $ や $ succ false $ のような項も含まれる。 | |
351 しかし、 $ succ $ を $ false $ に適用する評価結果は定義されていないため、 $ succ \; false $ は正規形である。 | |
352 このような、正規形であるが値でない項は行き詰まり状態であるという。 | |
353 つまり、実行時エラーとは行き詰まり状態の項を指す。 | |
354 直感的な解釈としてはプログラムが無意味な状態になったこと示しておい、操作的意味論が次に何も行なえないことを特徴付けているのである。 | |
355 プログラング言語において実行時エラーはセグメンテーションフォールトや不正な命令などいくつかのものが挙げられるが、型システムを考える際にはこれらのエラーは行き詰まり状態という単一の概念で表す。 | |
356 | |
357 % }}} | |
34 | 358 |
41 | 359 % {{{ 単純型 |
360 | |
40 | 361 \section{単純型} |
362 先程定義した算術式には $ pred \; false $ のようなこれ以上評価できない行き詰まり状態が存在する。 | |
363 項を実際に評価する前に評価が行き詰まり状態にならないことを保証したい。 | |
364 そのために、自然数に評価される項とブール値に評価される項とを区別する必要がある。 | |
365 項を分類するために2つの型 Nat と Bool を定義する。 | |
366 | |
367 ここで、項$t$が型 $T$を持つ、という表現を用いた場合、$t$を評価した結果が明らかに適切な形の値になることを意味する。 | |
368 明らかに、という意味は項を実行することなく静的に分かるという意味である。 | |
369 例えば項 $ if \; true \; then \; false \; else \; true $ は Bool 型を持ち、$ pred \; (succ \; (succ \; 0)) $ はNat 型を持つ。 | |
370 しかし、項の型の分析は保守的であり、$ if \; true \; then \; 0 \; else \; false $ のような項は実際には行き詰まりにならないが型を持てない。 | |
371 | |
372 算術式のための型付け関係は $ t : T $ と書き、項に型を割り当てる推論規則の集合によって定義される。 | |
373 具体的な数値とブール値に関する拡張は以下である。 | |
374 | |
375 \begin{definition} | |
376 NB(型付き) の新しい構文形式 | |
377 \begin{align*} | |
378 T ::= && \text{型 :} \\ | |
379 Bool && \text{ブール型} \\ | |
380 Nat && \text{自然数型} \\ | |
381 \end{align*} | |
382 \end{definition} | |
383 | |
384 | |
385 \begin{definition} | |
386 NB(型付き)の型付け規則 | |
387 \begin{align*} | |
388 true : Bool && \text{T-TRUE} \\ | |
389 false : Bool && \text{T-FALSE} \\ | |
390 \AxiomC{$t_1 : Bool$} | |
391 \AxiomC{$t_2 : T$} | |
392 \AxiomC{$t_3 : T$} | |
393 \TrinaryInfC{$if \; t_1 \; then \; t_2 \; else \; t_3 : T$} | |
394 \DisplayProof && \text{T-IF} \\ | |
395 0 : Nat && \text{T-ZERO} \\ | |
396 \AxiomC{$t_1 : Nat$} | |
397 \UnaryInfC{$ succ \; t_1 : Nat $} | |
398 \DisplayProof && \text{T-SUCC} \\ | |
399 \AxiomC{$t_1 : Nat$} | |
400 \UnaryInfC{$ pred \; t_1 : Nat $} | |
401 \DisplayProof && \text{T-PRED} \\ | |
402 \AxiomC{$t_1 : Nat$} | |
403 \UnaryInfC{$ iszero \; t_1 : Bool $} | |
404 \DisplayProof && \text{T-BOOL} | |
405 \end{align*} | |
406 \end{definition} | |
407 | |
408 T-TRUE と T-FALSE はブール定数に Bool 型を割り当てている。 | |
409 T-IFは条件式の部分にBool型を、部分式に関しては同じ型を要求している。 | |
410 これは同じ変数 $ T $ を二回使用することで制約を表している。 | |
411 | |
412 また、数に関しては T-ZERO は Nat 型を $ 0 $ に割り当てている。 | |
413 T-SUCC と T-PRED は $ t_1 $ が Nat である時に限り Nat 型となる。 | |
414 同様に、 T-ISZERO は $ t_1 $ が Nat である時に Bool となる。 | |
415 | |
416 \begin{definition} | |
417 算術式のための型付け関係とは、NBにおける規則のすべてのインスタンスを満たす、項と型の二項関係である。 | |
418 項$ t $ に対してある型 $ T $ が存在して $ t : T $ である時、 $ t $ は型付け可能である(または正しく型付けされている)という。 | |
419 \end{definition} | |
420 | |
41 | 421 型推論をを行なう時、$succ t_1$という項が何らかの型を持つならばそれは Nat 型である、といった言及を行なう。 |
422 型付け関係を逆転させた補題を定義することで型推論の基本的なアルゴリズムを考えることができる。 | |
423 なお、逆転補題は型付け関係の定義により直ちに成り立つ。 | |
424 | |
425 \begin{lemma} | |
426 型付け関係の逆転 | |
427 \begin{enumerate} | |
428 \item $ true : R $ ならば $ R = Bool $ である | |
429 \item $ false : R $ ならば $ R = Bool $ である | |
430 \item $ if \; t_1 \; then \; t_2 \; else \; t_3 : R $ ならば $ t_1 : Bool $ かつ $ t_2 : R $ かつ $ t_3 : R $ である。 | |
431 \item $ 0 : R $ ならば $ R = Nat $ である | |
432 \item $ succ \; t_1 : R $ ならば $ R = Nat $ かつ $ t_1 : Nat $ である | |
433 \item $ pred \; t_1 : R $ ならば $ R = Nat $ かつ $ t_1 : Nat $ である | |
434 \item $ iszero \; t_1 : R $ ならば $ R = Bool $ かつ $ t_1 : Nat $ である | |
435 \end{enumerate} | |
436 \end{lemma} | |
437 | |
438 逆転補題は型付け関係のための生成補題と呼ばれることもある。 | |
439 なぜならば、与えられた型付け判断式に対してその証明がどのように生成されたかを示すからである。 | |
440 | |
40 | 441 型無し算術式の評価導出のように型付けも導出可能であり、それも規則のインスタンスの木である。 |
442 型付け関係に含まれる二つ組 $(t, \; T)$は $ t : T $ を結論とする型付け導出により正当化される。 | |
443 例えば $ if \; (iszero \; 0) \; then \; 0 \; else \; (pred \; 0) : Nat $ の型付け判断の導出木である。 | |
444 | |
445 \begin{prooftree} | |
446 \AxiomC{} | |
447 \RightLabel{T-ZERO} | |
448 \UnaryInfC{$ 0 : Nat$} | |
449 \RightLabel{T-ISZERO} | |
450 \UnaryInfC{$ iszero \; 0 : Bool$} | |
451 \AxiomC{} | |
452 \RightLabel{T-ZERO} | |
453 \UnaryInfC{$ 0 : Nat$} | |
454 \AxiomC{} | |
455 \RightLabel{T-ZERO} | |
456 \UnaryInfC{$ 0 : Nat$} | |
457 \RightLabel{T-PRED} | |
458 \UnaryInfC{$ pred \; 0 : Bool$} | |
459 \RightLabel{T-IF} | |
460 \TrinaryInfC{ if \; (iszero \; 0) \; then \; 0 \; else \; (pred \; 0) : Nat } | |
461 \end{prooftree} | |
462 | |
41 | 463 項その型付けの定義より、型システムが行き詰まり状態にならないことを示す。 |
464 その証明は指向定理と保存定理によって証明する。 | |
465 | |
466 \begin{itemize} | |
467 \item 進行とは、正しく型付けされた項は行き詰まり状態では無いことである | |
468 \item 保存とは、評価可能な正しく型付けされた項は評価後も正しく型付けされていることである。 | |
469 \end{itemize} | |
470 | |
471 型システムがこれらの性質を持つ時、正しく型付けされた項は行き詰まり状態になりえない。 | |
472 | |
473 進行定理の証明の為に Bool 型と Nat 型の標準形(それらの型を持つ正しく型付けされた値)を示す。 | |
474 | |
475 \begin{lemma} | |
476 標準形 | |
477 | |
478 \begin{enumerate} | |
479 \item $ v $ が $Bool$ 型の値ならば $v$ は $true$ または $false$ である。 | |
480 \item $v$ が $Nat$ 型の値ならば、$0$ もしくは $Nat$ に対して $succ$ を適用した値である。 | |
481 \end{enumerate} | |
482 \end{lemma} | |
483 | |
484 標準形の証明に関しては値における構造的帰納法を用いる。 | |
485 この言語における値とは $ true $ と $false $ と $ 0$ と $ succ \; nv$ のいずれかの形をしている。 | |
486 Bool型に関して注目した時、 $ true $ と $ false $ は定義によって正しい。 | |
487 $ 0 $ と $ succ \; nv $ に関しては逆転補題より Nat 型を持つため、Bool型を持つ値は $ true $ と $ false $ のどちらかとなる。 | |
488 Nat についても同様である。 | |
489 | |
490 \begin{theorem} | |
491 進行 | |
492 | |
493 $ t$ が正しく型付けされたと仮定すると、$ t$ は値であるか、またはある $t'$ が存在して$ t \rightarrow t' $ となる。 | |
494 \end{theorem} | |
495 | |
496 証明は $ t : T $ の導出に関する帰納法による。 | |
497 T-TRUE 、 T-FALSE 、 T-ZERO の場合は$t$が値であることより成立する。 | |
498 | |
499 T-IF の場合、帰納法の仮定により $ t1 $ は値であるか、$t_1'$ が存在して $ t_1 \rightarrow t_1'$ を満たす。 | |
500 $ t_1 $ が値ならば、標準形補題により $ true $ か $ false $ であり、その場合は E-IFTRUE か E-IFFALSE が適用可能である。 | |
501 一方 $ t_1 \rightarrow t_1' $ ならば E-IF が適用できる。 | |
502 | |
503 T-SUCC の場合も帰納法の仮定により $ t1 $ は値であるか、$t_1'$ が存在して $ t_1 \rightarrow t_1'$ を満たす。 | |
504 $ t_1 $ が値ならば標準形補題により数値でなければならず、その場合 $ t $ も数値であるため成り立つ。 | |
505 一方 $ t_1 \rightarrow t_1' $ ならば E-SUCC が適用できる。 | |
506 | |
507 T-SUCC の場合も同様で、 $ t_1 $ が値ならば標準形補題により数値でなければならず、その場合 E-PREDZERO か E-PREDSUCC が使える。 | |
508 $ t_1 \rightarrow t_1' $ ならば E-PRED が適用できる。 | |
509 | |
510 T-ISZERO の場合も値ならば標準形補題により $ t_1 $ は数値であり、どちらの場合でも E-ISZEROZERO と E-ISZEROSUCC が適用できる。 | |
511 $ t_1 \rightarrow t_1' $ ならば E-ISZERO が適用できる。 | |
512 | |
513 \begin{theorem} | |
514 保存 | |
515 | |
516 $ t : T $ かつ $ t \rightarrow t' $ ならば $ t' : T $ となる。 | |
517 \end{theorem} | |
518 | |
519 保存定理も $ t : T $ の導出に関する帰納法によって導ける。 | |
520 帰納法の各ステップにおいて全ての部分導出に関して所望の性質が成り立つと仮定し、導出の最後の規則についての場合分けで証明を行なう。 | |
521 | |
522 導入の最後の規則がT-TRUE の場合、その規則の形から $ t $ は定数 $ true $ でなければならず、 $ T $ は $ Bool$ となる。 | |
523 そして $ t $ は値であるためにどのような $ t' $ も存在せず、定理の要求は満たされる。 | |
524 T-FALSE と T-ZERO の場合も同様である。 | |
525 | |
526 導入の最後の規則 T-IF の場合は、$ t $ はある $ t_1, \; t_2 \; t_3 $ に対して $ if \; t_1 then t_2 else t_3 $ という形となる。 | |
527 さらに $ t_1 : Bool $ と $ t_2 : T $ と $ t_3 : T $ となる部分導出がある。 | |
528 ここで if を持つ評価規則において $ t \rightarrow t'$ を導入できる規則は E-IFTRUE と E-IFFALSE と E-IF のみである。 | |
529 それぞれの場合について別々に場合分けをして考える。 | |
530 | |
531 \begin{itemize} | |
532 \item E-IFTRUE の場合(E-IFFALSE も同様) | |
533 | |
534 $ t \rightarrow t' $ が E-IFTRUE を使った導出ならば、 $ t_1$ は $ true $ であり、結果の項 $ t' $ は $ t_2 $ となる。 | |
535 このことより $ t_2 : T $ であることが分かるため、条件を満たす。 | |
536 | |
537 \item E-IF の場合 | |
538 | |
539 場合分け T-IF の仮定より $ t_1 : Bool $が結論となる、部分導出が得られる。 | |
540 帰納法の仮定を部分導出に適用して $ t_1' : Bool $ とし、 $ t_2 : T $ と $ t_3 : T $ を合わせると規則 T-IF が適用できる。 | |
541 T-IF を適用すると $ if \; t_1' \; then \; t_2 \; else \; t_3$となり、$ t' : T $ が成り立つ。 | |
542 \end{itemize} | |
543 | |
544 T-SUCC が導入の最後であれば、 $ t \rightarrow t'$ を導くためには E-SUCC のみであり、この形から $ t_1 \rightarrow t_1'$が分かる。 | |
545 $ t_1 : Nat $ であることも分かるため、帰納法の仮定より $ t_1' : Nat $ が得られる。 | |
546 この時 T-SUCC が適用できるため $ succ \; t_1 : Nat$となって $ t' : T $ が成り立つ。 | |
547 T-PRED も同様である。 | |
548 | |
549 % }}} | |
40 | 550 |
32 | 551 % {{{ 型なしラムダ計算 |
30
55f67e448dcc
Add type system description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
28
diff
changeset
|
552 \section{型なしラムダ計算} |
38 | 553 計算とは何か、エラーとは何か、を算術式を定義することによって示してきた。 |
41 | 554 また、型を導入することにより行き詰まり状態を回避することも示した。 |
38 | 555 ここで、プログラミング言語における計算を形式的に定義していく。 |
31 | 556 プログラミング言語は複雑だが、その計算はある本質的な仕組みからの派生形式として定式化可能であることを Peter Ladin が示した。 % TODO: ref TaPL 61 |
38 | 557 この時 Landin が使った本質的な仕組みとしての核計算がラムダ計算であった。 |
31 | 558 ラムダ計算は Alonzo Church が発明した形式的体系の一つである。 % TODO: ref |
559 ラムダ計算では全ての計算が関数定義と関数適用の基本的な演算に帰着される。 | |
560 ラムダ計算はプログラミング言語の機能の仕様記述や、言語設計と実装、型システムの研究に多く使われている。 | |
561 この計算体系の重要な点は、ラムダ計算内部で計算が記述できるプログラミング言語であると同時に、それ自身について厳格な証明が可能な数学的対象としてみなせる点にある。 | |
28 | 562 |
31 | 563 ラムダ計算はいろいろな方法で拡張できる。 |
564 数や組やレコードなどはラムダ計算そのもので模倣することができるが、記述が冗長になってしまう。 | |
565 それらの機能のための具体的な特殊構文を加えることは言語の利用者の視点で便利である。 | |
566 他にも書き換え可能な参照セルや非局所的な例外といった複雑な機能を表現することもできるが、膨大な変換を用いなければモデル化できない。 | |
567 それらを言語として備えた拡張に ML や Haskell といったものがある。 % TODO: ref | |
568 | |
569 ラムダ計算(または $ \lambda $ 計算) とは、関数定義と関数適用を純粋な形で表現する。 | |
570 ラムダ計算においてはすべてが関数である。 | |
571 関数によって受け付ける引数も関数であり、関数が返す結果もまた関数である。 | |
572 | |
573 ラムダ計算の項は変数と抽象と適用の3種類の項からなり、以下の文法に要約される。 | |
574 変数 $ x $ は項であり、項 $ t_1 $ から変数 $ x $ を抽象化した $ \lambda x . t_1 $ も項であり、項 $ t_1 $ を他の項 $ t_2 $ に適用した $ t_1 t_2 $ も項である。 | |
575 | |
576 \begin{multline*} | |
577 t ::= \\ | |
578 x \\ | |
579 \lambda x . t \\ | |
580 t \, t \\ | |
581 \end{multline*} | |
582 | |
583 ラムダ計算において関数適用は左結合とする。 | |
584 つまり、 $ s \, t \, u $ は $ (s \, t) \, u $ となる。 | |
585 | |
586 また、抽象の本体はできる限り右側へと拡大する。 | |
587 例えば $ \lambda x . \; \lambda y . \; x \, y \, x $ は $ \lambda x . (\lambda . y ((x \, y) \, x)) $ となる。 | |
588 | |
589 ラムダ計算には変数のスコープが存在する。 | |
590 抽象 $ \lambda x . t $ の本体 $ t $ の中に変数 $ x $ がある時、 $ x $ の出現は束縛されていると言う。 | |
591 同様に、 $ \lambda x $ は $ t $ をスコープとする束縛子であると言う。 | |
592 なお、 $ x $ を囲む抽象によって束縛されていない場所の $ x $ の出現は自由であると言う。 | |
593 例えば $ x \; y $ や $ \lambda y . \; x \; y $ における $ x $ の出現は自由だが、 $ \lambda x . x $ や $ \lambda z . \lambda x . \lambda y . x (y \; z) $ における $ x $ の出現は束縛されている。 | |
594 $ (\lambda x . x) \;x $ においては、最初の $ x $ の出現は束縛されているが、2つ目の出現は自由である。 | |
595 | |
596 ラムダ計算において、計算とは引数に対する関数の適用である。 | |
597 抽象に対して項を適用した場合、抽象の本体に存在する束縛変数に適用する項を代入したもので書き換える。 | |
598 図式的には | |
599 | |
600 \begin{equation*} | |
601 (\lambda x . t_{12}) t_2 \rightarrow [ x \mapsto t_2] t_{12} | |
602 \end{equation*} | |
603 | |
604 と記述する。 | |
605 ここで $ [ x \mapsto t_2] t_{12} $ とは、$ t_12 $ 中の自由な $ x $ を全て $ t_2 $ で置換した項を意味する。 | |
606 例えば、 $ (\lambda x . x) \; y $ は $ y $ となり、項 $ (\lambda x . x (\lambda x . x)) (y \; z) $ は $ y \; z \; (\lambda x . x) $ となる。 | |
607 | |
608 なお、 $ (\lambda x . t_{12}) t_2 $ という形の項を簡約基(redex, reducible expression) と呼び、上記の規則で簡約基を置換する操作をベータ簡約と呼ぶ。 | |
609 ラムダ計算のための評価戦略には数種類の戦略がある。 | |
610 | |
611 \begin{itemize} | |
612 \item 完全ベータ簡約 | |
613 | |
614 任意の簡約基がいつでも簡約されうる。 | |
615 つまり項の中からどの順番で簡約しても良い。 | |
616 | |
617 \item 正規順序簡約 | |
618 | |
619 最も左で最も外側の簡約基が最初に簡約される。 | |
620 | |
621 \item 名前呼び | |
622 | |
623 正規順序の中でも抽象の内部での簡約を許さない。 | |
624 名前呼びの変種は Algol-60 や Haskell で利用されている。 | |
625 なお、Haskell においては必要呼びという最適化された変種を利用している。 | |
626 | |
627 \item 値呼び | |
628 | |
629 ほとんどの言語はこの戦略を用いている。 | |
630 基本的には最も左の簡約基をを簡約するが、右側が既に値(計算が終了してもう簡約できない閉じた項)になっている簡約基のみを簡約する。 | |
631 \end{itemize} | |
632 | |
633 値呼び戦略は関数の引数が本体で使われるかに関わらず評価され、これは正格と呼ばれる。 | |
634 名前呼びなどの非正格な戦略は引数が使われる時のみ評価され、これは遅延評価とも呼ばれる。 | |
635 | |
636 ラムダ計算において、複数の引数は、関数を返り値として返す高階関数として定義できる。 | |
32 | 637 項 $ s $ が二つの自由変数 $ x $ と $ y $ を含むとすれば、 $ \lambda x . \lambda y . s $ と書くことで二つの引数を持つ関数を表現できる。 |
638 これは $ x $ に $ v $ が与えられた時、$ y $ を受けとり、 $ s $ の抽象内の自由な $ x $ を $ v $ に置き換えた部分を置換する関数、を返す。 | |
639 例えば $ (\lambda x . \lambda y . s) \; v \; w $ は $ (\lambda y . [x \mapsto v] s) w $ に簡約され、 $ [y \mapsto w][x \mapsto v]s $ に簡約される。 | |
640 なお、複数の引数を取る関数を高階関数に変換することはカリー化と呼ばれる。 | |
641 | |
39 | 642 % TODO: ラムダの再帰とかペアとかの解説 |
643 | |
644 ラムダ計算の帰納的な項は以下のように定義される。 | |
645 | |
646 \begin{definition} | |
647 $ V $ を変数名の加算集合とする。項の集合は以下を満たす最小の集合 $ T $ である。 | |
648 | |
649 \begin{eqnarray*} | |
650 任意の x \in V について x \in T \\ | |
651 t_1 \in T かつ x in V ならば \lambda x . t \in T \\ | |
652 t_1 \in T かつ t_2 \in T ならば t_1 \; t_2 \in T | |
653 \end{eqnarray*} | |
654 \end{definition} | |
655 | |
656 また、形式的な自由変数の定義を与える。 | |
657 | |
658 \begin{definition} | |
659 項 $ t $ の自由変数の集合は $ FV(t)$と書き、以下のように定義される。 | |
660 | |
661 \begin{eqnarray*} | |
662 FV(x) = \{ x \} \\ | |
663 FV(\lambda . t_1 x) = FV(t_1) \setminus \{ x \} \\ | |
664 FV(t_1 \; t_2) = FV(t_1) \cup FV(t_2) | |
665 \end{eqnarray*} | |
666 \end{definition} | |
667 | |
668 記号 $ \setminus $ は集合に対する二項演算子であり、$ S \setminus T := {x \in S : x \notin T}$ である。 | |
669 つまり、$ t_1 $の内部の自由変数の集合から $ x $ を抜いた集合である。 | |
670 | |
671 最後に代入について定義する。 | |
32 | 672 代入の操作は直感的には置換であるが、変数の束縛に注意しなくてはならない。 |
673 例えば抽象への代入を以下のように定義する。 | |
674 | |
675 \begin{equation*} | |
676 [ x \mapsto s ] (\lambda y . t_1) = \lambda y . [ x \mapsto s] t_1 | |
677 \end{equation*} | |
678 | |
679 この場合、束縛変数の名前によっては定義が破綻してしまう。例えば以下のようになる。 | |
680 | |
681 \begin{equation*} | |
682 [x \mapsto y](\lambda x . x) = \lambda x . y | |
683 \end{equation*} | |
684 | |
685 $ \lambda $ よって束縛されているはずの $ x $ が書き変わっている。 | |
686 これはスコープとして振る舞っていないので誤っている。 | |
687 この問題は項 $ t $ 内の変数 $ x $ の自由な出現と束縛された出現を区別しなかったために出現した誤りである。 | |
688 | |
689 そこで、$ x $ を束縛する項に対しては置換行なわないように定義を変える。 | |
690 | |
691 \begin{itemize} | |
692 \item $ y = x $ の場合 | |
693 \begin{equation*} | |
694 [ x \mapsto s ] (\lambda y . t_1) = \lambda y . t_1 | |
695 \end{equation*} | |
696 | |
697 \item $ y \neq x $ の場合 | |
698 \begin{equation*} | |
699 [ x \mapsto s ] (\lambda y . t_1) = \lambda y . [ x \mapsto s] t_1 | |
700 \end{equation*} | |
701 \end{itemize} | |
702 | |
703 この場合は束縛された変数を上書きしないが、逆に自由変数を束縛するケースが発生する。 | |
704 具体的には以下である。 | |
705 | |
706 \begin{equation*} | |
707 [ x \mapsto z] (\lambda z . x) = \lambda z . z | |
708 \end{equation*} | |
709 | |
710 項 $ s $ 中の自由変数が項 $ t $ に代入されて束縛される現象は変数捕獲と呼ばれる。 | |
711 これを避けるためには $ t $ の束縛変数の名前が $ s $ の自由変数の名前と異なることを保証する必要がある。 | |
712 変数捕獲を回避した代入操作は捕獲回避代入と呼ばれる。 | |
33
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
713 代入における名前の衝突を回避するために項の束縛変数の名前を一貫して変更することで変数捕獲を回避する方法も存在する。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
714 束縛変数の名前を一貫して変更することをアルファ変換と呼ばれる。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
715 これは関数抽象に対する束縛変数は問わないという直感からくるもので、 $ \lambda x . x $ も $ \lambda y . y $ も振舞いとしては同じ関数であるとみなすものである。 |
32 | 716 捕獲回避の条件を追加した代入の定義は以下のような定義となる。 |
717 | |
718 \begin{itemize} | |
719 \item 変数への代入 | |
720 | |
721 \begin{equation*} | |
722 [ x \mapsto s ] x = s | |
723 \end{equation*} | |
724 | |
725 \item 存在しない変数への代入($ y \neq x $ の時) | |
726 | |
727 \begin{equation*} | |
728 [ x \mapsto s ] y = y | |
729 \end{equation*} | |
730 | |
731 \item 抽象内の項への代入($ y \neq x $ かつ $ y $ が $ s $ の自由変数でない) | |
732 | |
733 \begin{equation*} | |
734 [ x \mapsto s ] (\lambda y . t_1) = \lambda y . [ x \mapsto s] t_1 | |
735 \end{equation*} | |
736 | |
737 \item 適用への代入 | |
738 | |
739 \begin{equation*} | |
740 [x \mapsto s] (t_1 \; t_2) = (t_1[x\mapsto s])([x \mapsto s] t_2) | |
741 \end{equation*} | |
742 | |
743 \end{itemize} | |
744 | |
745 この定義は少なくとも代入が行なわれる際には正しく代入が行なえる。 | |
33
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
746 さらに、抽象が束縛している変数を名前では無く数字として扱う名無し表現も存在する。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
747 これは De Brujin 表現と呼ばれ、コンパイラ内部などでの項表現として用いられる。 % TODO: ref and spell check |
32 | 748 |
39 | 749 最終的な型無しラムダ計算 $ \lambda $ の項の定義と評価の要約を示す。 |
750 | |
751 \begin{definition} | |
752 $ \rightarrow $ (型無し) | |
753 | |
754 項 | |
755 \begin{align*} | |
756 t ::= && \text{項} \\ | |
757 \lambda x . t && \text{ラムダ抽象} \\ | |
758 t \; t && \text{関数適用} | |
759 \end{align*} | |
760 | |
761 値 | |
762 \begin{align*} | |
763 v ::= && \text{値} \\ | |
764 \lambda x . t && \text{ラムダ抽象値} | |
765 \end{align*} | |
766 | |
767 評価( $ t \rightarrow t' $) | |
768 | |
769 \begin{align*} | |
770 \AxiomC{$ t_1 \rightarrow t_1'$} | |
771 \UnaryInfC{$t_1 \; t_2 \rightarrow t_1' t_2$} | |
772 \DisplayProof && \text{E-APP1} \\ | |
773 \AxiomC{$ t_2 \rightarrow t_2'$} | |
774 \UnaryInfC{$v_1 \; t_2 \rightarrow v_1 t_2'$} | |
775 \DisplayProof && \text{E-APP2} \\ | |
776 (\lambda x . t_{12}) \; v_2 \rightarrow [ x \mapsto v_2] t_{12} | |
777 && \text{E-APPABS} | |
778 \end{align*} | |
779 \end{definition} | |
32 | 780 |
33
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
781 項は変数かラムダ抽象か関数適用の3つにより構成される。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
782 また、ラムダ抽象値は全て値である。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
783 加えて評価は関数適用を行なう E-APPABS 計算規則と、適用の項を書き換える E-APP1 と E-APP2 合同規則により定義される。 |
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
784 |
39 | 785 この定義からも評価戦略と評価順序が分かる。 |
786 関数を適用する E-APPABS は左側が抽象であり、右側が値である $v_2$ の時にしか適用されない。 | |
787 逆に、規則 E-APP1 の$t_1$は任意の項にマッチするため関数部分が値でない関数適用に用いる。 | |
788 一方、E-APP2 は左辺が値であるようになるまで評価されない。 | |
789 よって、関数適用 $ t_1 \; t_2 $ の評価順は、まずE-APP1を用いて$t_1$が値となった後にE-APP2を用いて$t_2$を値とし、最後にE-APPABSで関数を適用を行なう。 | |
33
74a29a48575a
Update lambda description
atton <atton@cr.ie.u-ryukyu.ac.jp>
parents:
32
diff
changeset
|
790 |
32 | 791 |
792 % }}} | |
28 | 793 |
43 | 794 % {{{ 単純型付きラムダ計算 |
795 | |
28 | 796 \section{単純型付きラムダ計算} |
42 | 797 型無しラムダ計算に対して単純型を適用する場合、ラムダ抽象の型について考える必要がある。 |
798 ラムダ抽象は値を取って値を返すため、関数として考えることもできる。 | |
799 差し当たりBool型における関数の型を $ \lambda x . t : \rightarrow $ と定義する。 | |
800 この定義においては $ \lambda x . true $ についても $\lambda x . \lambda y . y $ のような型も同一の型を持つ。 | |
801 この二つの項は値を適用すると値を返すという点では同じであるが、前者は $ true $ を返し、後者は $ \lambda y . y $ を返す。 | |
802 これでは関数を適用した際に返す値の型は関数の型から予測できず、加えてどの値に対して適用可能かも分からない。 | |
803 そのために引数にどのような型を期待しているのか、正しい型の値を適用するとどの型の値を返すのかを型情報に追加する。 | |
804 具体的には以下のように $ \rightarrow $ を $ T_1 \rightarrow T_2 $ の形をした無限の型の族に置き換える。 | |
805 | |
806 \begin{definition} | |
807 型 Bool 上の単純型の集合は次の文法により生成される。 | |
808 | |
809 \begin{align*} | |
810 t ::= && 型 : \\ | |
811 T \rightarrow T && 関数の型 \\ | |
812 Bool && ブール値型 | |
813 \end{align*} | |
814 \end{definition} | |
815 | |
816 なお、型構築子 $ \rightarrow $ は右結合である。 | |
817 つまり $ T_1 \rightarrow T_2 \rightarrow T_3 $ は$ T_1 \rightarrow (T_2 \rightarrow T_3) $となる。 | |
818 | |
819 $ \lambda x . t $ に対して型を割り当てる時、明示的に型付けする方法と暗黙的に型付けする方法がある。 | |
820 明示的に型付けを行なう場合はプログラマが項に型の注釈を記述する。 | |
821 暗黙的に型付けを行なう場合は型検査器に情報を推論させ、型を再構築させる。 | |
822 型推論は $ \lambda $ 計算の文献内では型割り当て体系と呼ぶこともある。 | |
823 今回は明示的に型を指定する方法を取る。 | |
824 | |
825 $ \lambda $ 抽象の引数の型が分かれば、結果の型は本体 $ t_2 $となる。 | |
826 ここで、$ t_2 $内における $ x $ の出現は型 $ T_1 $ の項を表すと仮定する必要がある。 | |
827 これは引数に対して正しい型の値が渡されたにも関わらず抽象内で異なる型として振る舞うのを禁止するためである。 | |
828 この $ \lambda $ 抽象の型付けは以下の T-ABS によって定義される。 | |
829 | |
830 | |
831 \begin{align*} | |
832 \AxiomC{$x : T_1 \vdash t_2 : T_2$} | |
833 \UnaryInfC{$ \vdash \lambda x : T_1 . t_2 : T_1 \rightarrow T_2$} | |
834 \DisplayProof && \text{T-ABS} | |
835 \end{align*} | |
836 | |
837 項は抽象を入れ子で持つ可能性があるため、引数の仮定は複数持ちうる。 | |
838 このため型付け関係は二項関係 $ t : T $ から、三項関係 $ \Gamma \vdash t : T $ となる。 | |
839 ここで $ \Gamma $ とは $ t $ に表われる自由変数の型の仮定の集合である。 | |
840 $ \Gamma $ は型付け文脈や型環境と呼ばれ、$ \Gamma \vdash t : T $ は「型付け文脈 $ \Gamma $ において項 $ t$ は型$T$を持つ」と読む。 | |
841 空の文脈は $ \emptyset$ と書かえることもあるが、通常は省略して $ \vdash t : T $ と書く。 | |
842 また、型環境に対する $ , $ 演算子は $ \Gamma $ の右に新しい束縛を加えて拡張する。 | |
843 | |
844 新しい束縛と既に $ \Gamma $ に表われている束縛は混同しないように名前 $ x$は$\Gamma $に存在しない名前から選ばれるものとする。 | |
845 これはアルファ変換により$\lambda$抽象の束縛名は一貫して変更ができるため、常に満たせる。 | |
846 | |
847 ラムダ抽象に型を持たせる規則の一般的な形は | |
848 | |
849 \begin{align*} | |
850 \AxiomC{$ \Gamma, x : T_1 \vdash t_2 : T_2$} | |
851 \UnaryInfC{$ \Gamma \vdash \lambda x : T_1 . t_2 : T_1 \rightarrow T_2$} | |
852 \DisplayProof && \text{T-ABS} | |
853 \end{align*} | |
854 | |
855 であり、変数の型付け規則は | |
856 | |
857 \begin{align*} | |
858 \AxiomC{$ x : T \in \Gamma $} | |
859 \UnaryInfC{$ \Gamma \vdash x : T$} | |
860 \DisplayProof && \text{T-VAR} | |
861 \end{align*} | |
862 | |
863 である。 | |
864 $ x : T \in T $ は 、$ \Gamma$において $x$ に仮定された型は $ T $ である、と読む。 | |
865 | |
866 最後に関数適用の型付け規則を定義する。 | |
867 | |
868 \begin{align*} | |
869 \AxiomC{$ \Gamma \vdash t_1 : T_{11} \rightarrow T_{12}$} | |
43 | 870 \AxiomC{$ \Gamma \vdash t_2 : T_{11}$} |
42 | 871 \BinaryInfC{$ \Gamma \vdash t_1 \; t_2 : T_{12}$} |
872 \DisplayProof && \text{T-APP} | |
873 \end{align*} | |
874 | |
875 もし $t_1$ が$ T_{11}$の引数を $ T_{12}$の計算結果に移す関数へ評価され、$ t_2$が型$T_{11}$の計算結果にに評価されるのであれば、$t_1$ を $ t_2$に適用した計算結果は $ T_{12}$の型を持つ。 | |
876 ブール定数と条件式の型付け規則は型付き算術式と時と同様である。 | |
877 | |
43 | 878 最終的な純粋単純型付きラムダ計算の規則を示す。 |
879 純粋とは基本型を持たないという意味であり、純粋単純型付きラムダ計算にはブールのような型を持たない。 | |
880 この純粋単純型付きラムダ計算でブール値を扱う場合は型環境$\Gamma$を考慮してブール値の規則を追加すれば良い。 | |
42 | 881 |
882 \begin{definition} | |
43 | 883 $ \rightarrow $ (型付き)の構文 |
42 | 884 |
885 \begin{align*} | |
886 t ::= && \text{項} \\ | |
887 x && \text{変数} \\ | |
888 \lambda x : T . t && \text{ラムダ抽象} \\ | |
889 t \; t && \text{関数適用} \\ | |
890 \end{align*} | |
43 | 891 |
892 \begin{align*} | |
893 v ::= && \text{項} \\ | |
894 \lambda x : T . t && \text{ラムダ抽象値} \\ | |
895 \end{align*} | |
896 | |
897 \begin{align*} | |
898 T ::= && \text{型} \\ | |
899 T \rightarrow T && \text{関数型} \\ | |
900 \end{align*} | |
901 | |
902 \begin{align*} | |
903 \Gamma ::= && \text{文脈} \\ | |
904 \emptyset && \text{空の文脈} \\ | |
905 \Gamma , x : T && \text{項変数の束縛} \\ | |
906 \end{align*} | |
42 | 907 \end{definition} |
908 | |
43 | 909 \begin{definition} |
910 $ \rightarrow $ (型付き)の評価($ t \rightarrow t'$) | |
911 | |
912 \begin{align*} | |
913 \AxiomC{$t_1 \rightarrow t_1'$} | |
914 \UnaryInfC{$t_1 \; t_2 \rightarrow t_1' \; t_2$} | |
915 \DisplayProof && \text{E-APP1} \\ | |
916 \AxiomC{$t_2 \rightarrow t_2'$} | |
917 \UnaryInfC{$v_1 \; t_2 \rightarrow v_1 \; t_2'$} | |
918 \DisplayProof && \text{E-APP2} \\ | |
919 (\lambda x : T_{11} . t_{12}) v_2 \rightarrow [ x \mapsto v_2] t_{12} && | |
920 \text{E-APPABS} | |
921 \end{align*} | |
922 \end{definition} | |
923 | |
924 \begin{definition} | |
925 $ \rightarrow $ (型付き)の型付け($\Gamma \vdash t : T $) | |
926 | |
927 \begin{align*} | |
928 \AxiomC{$ x : T \in \Gamma$} | |
929 \UnaryInfC{$\Gamma \vdash x : T $} | |
930 \DisplayProof && \text{T-VAR} \\ | |
931 \AxiomC{$\Gamma , x : T_1 \vdash t_2 : T_2$} | |
932 \UnaryInfC{$\Gamma \vdash \lambda x : T_1 . t_2 : T_1 \rightarrow T_2$} | |
933 \DisplayProof && \text{E-ABS} \\ | |
934 \AxiomC{$ \Gamma \vdash t_1 : T_{11} \rightarrow T_{12}$} | |
935 \AxiomC{$ \Gamma \vdash t_2 : T_{11}$} | |
936 \BinaryInfC{$\Gamma \vdash t_1 \; t_2 : t_{12}$} | |
937 \DisplayProof && \text{T-APP} | |
938 \end{align*} | |
939 \end{definition} | |
940 | |
941 単純型付きラムダ計算の型付け規則のインスタンスも型付き算術式のように導出木をすることで示せる。 | |
942 例えば $ (\lambda x : Bool\; x) \; true $ が空の文脈において $ Bool$を持つことは以下の木で表せる。 | |
943 | |
944 \begin{prooftree} | |
945 \AxiomC{$ x : Bool \in x : Bool$} | |
946 \RightLabel{T-VAR} | |
947 \UnaryInfC{$x : Bool \vdash x : Bool$} | |
948 \RightLabel{T-ABS} | |
949 \UnaryInfC{$\vdash \lambda x : Bool . x : Bool \rightarrow Bool$} | |
950 \AxiomC{} | |
951 \RightLabel{T-TRUE} | |
952 \UnaryInfC{$\vdash true : Bool$} | |
953 \RightLabel{T-APP} | |
954 \BinaryInfC{$\vdash (\lambda x : Bool . x) \; true : Bool $} | |
955 \end{prooftree} | |
956 | |
957 純粋型付きラムダ計算の型システムにおいて、閉じた項に対して進行定理と保存定理は成り立つ\ref{Pierce:2002:TPL:509043}\ref{pierce2013型システム入門プログラミング言語と型の理論}。 % FIXME: 進行定理と保存定理の証明。 | |
958 閉じた項、という制限が付いているのは $ f \; true $ といった自由変数が存在する項は正規形ではあるが値でないからである。 | |
959 しかし、開いた項に関しては評価が行なえないために型システムの検査対象に含まれない。 | |
960 | |
961 % }}} | |
962 | |
28 | 963 \section{部分型付け} |
964 \section{部分型と Continuation based C} |