η-преобразование против экстенсиональности в расширениях лямбда-исчисления

Меня часто смущает связь между η-преобразованием и экстенсиональностью.

Редактировать: Согласно комментариям, мне кажется, я также запутался в связи между экстенсиональной эквивалентностью и наблюдательной эквивалентностью. Но, по крайней мере, в Agda с экстенсиональным равенством для функций (в качестве постулата) и для лямбда-исчисления с простыми типами (которое имеет полностью абстрактную семантику, если я не ошибаюсь), денотационная эквивалентность такая же, как наблюдательная эквивалентность. Не стесняйтесь поправлять меня в комментариях или ответах; Я никогда не получал систематического образования по этим вопросам.

В нетипизированном лямбда-исчислении это-правило дает ту же систему доказательств, что и правило экстенсиональности, как доказано Барендрегтом (цитируется в ответе на этот вопрос ). Я понимаю, что это означает, что система доказательств с eta-правилом является полной для наблюдательной эквивалентности (из других ответов, для которых может потребоваться правило ξ-правила, то есть сокращение под связывателями IIUC; у меня нет проблем с добавлением этого правила) ,

Однако что произойдет, если мы перейдем к типизированному исчислению и добавим расширение этого исчисления дополнительными базовыми типами и соответствующими формами введения и исключения? Можем ли мы написать полную систему доказательств для наблюдательной эквивалентности? Я буду говорить о системах доказательства в форме аксиоматической семантики, следуя Основам языков программирования Митчелла (FPL); система доказательств / аксиоматическая семантика определяет эквивалентность программы.

Вопрос 1 : распространяется ли теорема Барендрегта на STLC? Является ли η-эквивалентность эквивалентной экстенсиональности в этом контексте?

Я просматривающие обсуждения Fpl по PCF (но не закончил раздел еще), и, кажется , что после добавления пары, объемность требуется дополнительное правило, а именно сюрьективное спаривание: pair (Proj1 P, Proj2 P) = P. Интересно, что это правило связывает введение и исключение пар точно так же, как η-правило связывает введение и исключение функций.

Вопрос 2 : Достаточно ли добавить аксиому сюръективного спаривания, чтобы доказать экстенсиональность в простом типе λ-исчисления с парами? редактирование : Вопрос 2b : является ли сюръективное спаривание η-закона, как η-закона, упомянутого в этой статье , из-за структурного сходства, которое я упоминаю?

Давайте пройдем весь путь до PCF сейчас. Описания равенства экстенсиональности, которые я видел, доказывают, что экстенсиональность подразумевает правило доказательства по индукции, но они не говорят, достаточно ли этого. Поскольку PCF полон по Тьюрингу, равенство экстентов неразрешимо . Но это не означает, что не существует полной системы доказательств, поскольку длина доказательств не ограничена. Более уместно, что такая система доказательств могла бы противоречить теоремам Гёделя о неполноте. И этот аргумент может относиться даже к PCF без fix, и к системе Гёделя Т.

Вопрос 3 : Существует ли полная система доказательств для наблюдательной эквивалентности в PCF? Как насчет ПКФ без fix?

Обновление: полная абстракция

Я отвечу здесь на комментарий к полной абстракции. Я думаю, что PCF страдает от двух разных видов проблем: у него нет завершения (через исправление), что приводит к потере полной абстракции, но у него также есть натуральные числа. Обе проблемы затрудняют восприятие эквивалентности наблюдений, но я верю независимо друг от друга.

С одной стороны, PCF теряет полную абстракцию, потому что параллелен или живет в семантической области (Plotkin 1977), и это, похоже, связано с нетерминацией. Ральф Лоудер (Ральф Лоудер, 2000, «Финальный ПКФ не разрешимый») показывает, что конечный ПКФ (без натуралов, но с нетерминацией) уже неразрешим; следовательно, (если я правильно подведу итог) полностью абстрактная семантика не может ограничиваться областями с вычислимыми операциями.

С другой стороны, возьмите систему Гёделя T, в которой нет терминации. (Я не уверен, что у него есть полностью абстрактная семантика, но я предполагаю, что да, потому что проблема упоминается только для PCF; домен должен содержать примитивные рекурсивные функции высшего порядка). Практические основы Harper для языков программирования обсуждают обсервационную эквивалентность для этого языка; Sec. 47.4 называется «Некоторые законы равенства» и показывает некоторые допустимые правила доказательства для наблюдательной эквивалентности. Нигде не говорится, является ли система доказательств завершенной, так что я думаю, что это не так, но также нигде не обсуждается, может ли она быть завершена. Мое лучшее предположение связано с теоремой Гёделя о неполноте.

pl.programming-languages lambda-calculus

— Blaisorblade
источник

Я думаю, что мог бы ответить на некоторые из них, но я не понимаю, о чем вы спрашиваете. Вопрос, на который вы ссылаетесь, не касается эквивалентности программы. Вы имеете в виду обсервационную эквивалентность? Для какой операционной семантики? Итак, по сути, если вы объясните, что именно означает «доказательство» в вопросе 1, я думаю, что могу догадаться, что происходит. Мое лучшее предположение: вам нужна эквациональная теория, полная для наблюдательной эквивалентности, и вы спрашиваете нас, достаточно ли

правил. Это оно?

η

$\eta$

— Андрей Бауэр

@AndrejBauer: ваше предположение верно, я начну обновлять вопрос.

— Blaisorblade

Я не уверен насчет операционной семантики - это имеет значение для оригинальных теорем?

— Blaisorblade

Я попытался уточнить вопрос дальше. Но я все еще думаю, что твоя лучшая догадка верна.

— Blaisorblade

Здесь есть небольшая проблема: не совсем понятно, что такое

для натуральных чисел! Если у вас просто есть только функции и типы продуктов, то вы в ясности: термины обсервационно эквивалентны, если они равны

. В целом, я думаю, что это связано с проблемой полной абстракции .

η

$\eta$

β η

$\beta\eta$

— Коди

Я не уверен, что смогу полностью ответить на ваш вопрос, но я сделаю попытку и задам несколько моих собственных вопросов, которые могут стимулировать дальнейшее обсуждение этой темы.

Моя первая точка зрения такова: два члена в нетипизированном калькуляторе называются наблюдаемыми равными тогда и только тогда, когда каждый член : Где заканчивается термин означает «имеет -нормальную форму» $t, t'$ $\lambda$ $M$

M T завершаясь \Leftrightarrow M T^{'} завершаясь

$M\ t \mbox{ terminates } \Leftrightarrow M\ t' \mbox{ terminates }$

β

$\beta$

Я считаю более естественным рассматривать термины с «дырами» или контекстами вместо просто терминов и писать вместо . Эти два представления, безусловно, эквивалентны (если переменные не связаны контекстом), так как абстракция позволяет превратить контекст в термин . $E[\_]$ $M$ $E[t]$ $M\ t$ $E[\_]$ $\lambda x.E[x]$

Теперь это факт , что наблюдательное равенство в бестиповом исчислении не учитываются при -equality! Действительно, существует целый класс терминов, которые оба не оканчиваются и не имеют нормальных головных форм и, следовательно, все они заметно равны. Их иногда называют вечными или неразрешимыми терминами , и вот два таких термина: и $\beta\eta$

(λ Икс, Икс Икс) (λ Икс, Икс Икс)

$(\lambda x. x\ x)(\lambda x. x\ x)$

Довольно легко показать, что эти члены не являются

-эквивалентными.

(λ Икс, Икс Икс Икс) (λ Икс, Икс Икс Икс)

$(\lambda x. x\ x\ x)(\lambda x. x\ x\ x)$

β η

$\beta\eta$

Если все вечные члены идентифицированы, то равенство наблюдений полностью фиксируется классическим результатом (см. Теорему Барендрегта 16.2.7).

Теперь о печатных исчислениях. Давайте сначала рассмотрим простой тип вычисления без натуральных чисел. Вышеупомянутое определение наблюдательного равенства становится тривиальным, так как каждый член нормализуется! Нам нужно более тонкое различие. Мы будем использовать равенство значений для замкнутых членов, определяемых индукцией по типу и . Давайте сначала добавим для каждого типа бесконечное число констант . Мы выберем некоторую константу $\lambda$ $t_1\downarrow t_2$ $t_1$ $t_2$ $A$ $c_A, c_A', c''_A,\ldots$ $c_x$ соответствующего типа, чтобы соответствовать каждой переменной . $x$

На базовой типа , тогда и только тогда -Руководитель нормальной формой является и что из является и , и в их соответствующих типах. $B$ $t_1\downarrow t_2$ $\beta$ $t_1$ $c\ u_1\ldots u_n$ $t_2$ $d\ v_1\ldots v_n$ $c=d$ $u_1\downarrow v_1,\ldots, u_n\downarrow v_n$
При типе стрелки если оба слагаемых -редуцируют к абстракции. $t_1\downarrow t_2$ $\beta$ $\lambda$

Обратите внимание, что я использую только преобразование в этом определении. $\beta$

Теперь я определяю контексты следующим образом: с контекстом заголовка, приложением, абстракцией и заменой (закрытыми терминами) соответственно.

[_] ∣ E [_] u ∣ t E [_] ∣ λ x . E [_] ∣ E [_] θ

$[\_]\mid E[\_]\ u\mid t\ E[\_]\mid \lambda x.\ E[\_]\mid E[\_]\theta$

Затем мы можем определить и , хорошо типизированные типа чтобы быть наблюдательно эквивалентными тогда и только тогда, когда для каждого контекста такие, что хорошо типизированы и замкнуты . мы напишем в этом случае $t$ $t'$ $T$ $E[\_]$ $E[t],E[t']$

Е [T] ↓ Е [T^{'}]

$E[t]\downarrow E[t']$

t =_{o b s} t^{'}

$t=_{\mathrm{obs}}t'$

Теперь легко заметить, что если то . Другое направление менее тривиально, но также справедливо: действительно, если , то мы можем показать, что слагаемые равны для по индукции по типу: $t=_{\beta\eta}t'$ $t=_{\mathrm{obs}}t'$ $t=_{\mathrm{obs}}t'$ $\beta\eta$

В базовом типе просто возьмите в качестве , а - подстановку, которая отправляет в . Имеем и . Имеем и $E[\_]$ $[\_]\theta$ $\theta$ $x$ $c_x$ $E[t]=t\theta$ $E[t']=t'\theta$ $t\theta\rightarrow_\beta c_x\ u_1\theta\ldots u_n\theta$ . Тогда мы имеем и, следовательно, . Теперь мы не можем сразу сделать вывод, что . Действительно, если и являются абстракциями, то тривиально ! Хитрость здесь в том, чтобы отправить $t'\theta\rightarrow_\beta c_{x'}\ v_1\theta\ldots v_n\theta$ $c_x=c_{x'}$ $x=x'$ $u_i\theta=_{\beta\eta}v_i\theta$ $u_i$ $v_i$ $\lambda$ $u_i\theta\downarrow v_i\theta$ $x$ до и повторять это столько раз, сколько необходимо. Я немного неясен в деталях здесь, но идея похожа на теорему Бома ( снова Барендрегт 10.4.2).
$λ \vec{y} . \tilde{c_{x}} (y_{1} \vec{c_{1}}) \dots (y_{n} \vec{c_{n}})$ $\lambda \vec{y}.\tilde{c_x}\ (y_1\vec{c_1})\ldots (y_n\vec{c_n})$
При типе стрелки выберите как , то есть приложение к с а не в или . По предположению индукции имеем: и, следовательно, что дает $E[\_]$ $[\_]\ c_y$ $c_y$ $c_y$ $y$ $t$ $t'$
$t c_{y} =_{β η} t^{'} c_{y}$ $t\ c_y \ =_{\beta\eta}\ t'\ c_y$ $t y =_{β η} t^{'} y$ $t\ y \ =_{\beta\eta}\ t'\ y$ и, наконец, по-равенству: $\lambda y.t\ y\ =_{\beta\eta}\ \lambda.t'\ y$ $\eta$ $t =_{β η} t^{'}$ $t\ =_{\beta\eta}\ t'$

Это было сложнее, чем ожидалось!

$\mathbb{N}$ $0$ $S$ $\mathrm{rec_T}$ $T$ $\beta$

р е c_{T} u v 0 \to_{β} u

$\mathrm{rec_T}\ u\ v\ 0\rightarrow_{\beta} u$

r e c_{T} u v (S n) \to_{β} v n (r e c_{T} u v n)

$\mathrm{rec_T}\ u\ v\ (S\ n)\rightarrow_{\beta} v\ n\ (\mathrm{rec_T}\ u\ v\ n)$

$\eta$

λ x . x =_{β η} r e c_{N} 0 (λ k m . S m)

$\lambda x.x\ =_{\beta\eta}\ \mathrm{rec_{\mathbb{N}}}\ 0\ (\lambda k\ m.S\ m)$

m

$m$

\frac{f (S x) =_{β η} h x (f x)}{f t =_{β η} r e c_{T} (f 0) h t}

$\frac{f\ (S\ x)\ =_{\beta\eta}\ h\ x\ (f\ x)}{f\ t\ =_{\beta\eta}\mathrm{rec_T}\ (f\ 0)\ h\ t}$

x

$x$

η

$\eta$

h

$h$

${\cal M}$ $t_{\cal M}$ $T$ $t_{\cal M}\ (S\ldots\ S\ 0)$ $n$ $S$ $1$ ${\cal M}$ $n$ $0$

${\cal M}$

t_{M} = λ x .0

$t_{\cal M}\ = \lambda x.0$

β η

$\beta\eta$

M

${\cal M}$

0 =_{β η} S 0

$0\ =_{\beta\eta}\ S\ 0$

T

$T$

t_{M} = λ x .0

$t_{\cal M}=\lambda x.0$

— Коди
источник

Спасибо за Ваш ответ! Мой первый вопрос: обычно ли в контекстах есть замены для наблюдательной эквивалентности? По крайней мере, статья Плоткина о LCF (1997) не делает этого (хотя я могу представить, что нечто подобное имело бы смысл в некотором исчислении замыканий, где что-то вроде подстановок является частью синтаксиса). Но я легко вижу, что для каждого контекста «подстановки» можно определить более (для меня) «стандартный» контекст, который использует только лямбда-абстракцию и приложение, скажем (λx. []) C_x; поэтому я предполагаю, что приведенная выше наблюдательная эквивалентность эквивалентна определению, к которому я привык.

— Blaisorblade

t = λ x .0

$t = \lambda x.0$

0 =_{β η} S 0

$0 =_{\beta\eta} S 0$

M

${\cal M}$

0 =_{β η} S 0

$0 =_{\beta\eta} S 0$

0 \neq_{β η} S 0

$0 \not=_{\beta\eta} S\ 0$

M

${\cal M}$

t = λ x . 0

$t = \lambda x . 0$

P A

$\mathrm{PA}$

0 \neq 1

$0\neq 1$

P A ⊬ 0 = 1

$\mathrm{PA}\not\vdash 0=1$

T

$T$

\frac{е 0 знак равно грамм 0 е (S 0) знак равно грамм (S 0) ...}{е знак равно грамм}

$\frac{f\ 0=g\ 0\quad f\ (S\ 0)=g\ (S\ 0)\ldots}{f=g}$

Это верно! Хотя иногда имеет смысл рассматривать такие «бесконечные» системы для теоретических целей (например, порядковый анализ).

— Коди