Понятный, интуитивно понятный вывод комбинатора с фиксированной точкой (Y комбинатор)?


28

Комбинатор FIX с фиксированной запятой (он же Y-комбинатор) в (нетипизированном) лямбда-исчислении ( λ ) определяется как:

FIX λf.(λx.f (λy.x x y)) (λx.f (λy.x x y))

Я понимаю его назначение и прекрасно отслеживаю выполнение его приложения; Я хотел бы понять, как вывести FIX из первых принципов .

Вот, насколько я понимаю, когда я пытаюсь получить это сам:

  1. FIX - это функция: FIXλ
  2. FIX использует другую функцию, , чтобы сделать ее рекурсивной: FIXfλf.
  3. Первый аргумент функции - это «имя» функции, используемое там, где предназначено рекурсивное приложение. Поэтому все появления первого аргумента для должны быть заменены функцией, и эта функция должна ожидать остальных аргументов (давайте просто предположим, что принимает один аргумент): FIXffffλf.f (λy.y)

Это где я не знаю, как «сделать шаг» в моих рассуждениях. Маленькие эллипсы указывают, где в моем FIX чего-то не хватает (хотя я могу узнать это только по сравнению с «настоящим» FIX).

Я уже прочитал « Типы и языки программирования» , который не пытается вывести его напрямую, а вместо этого отсылает читателя к «Маленькому интригану» за выводом. Я тоже это читал, и его «вывод» не был таким уж полезным. Более того, речь идет не о прямом выводе, а об использовании очень специфического примера и о специальной попытке написать подходящую рекурсивную функцию в .λ


1
Этот пост может быть полезным. В общем, я думаю, что простое прохождение и вычисление нескольких итераций комбинатора поможет выяснить, почему он работает.
Xodarap

2
Существует несколько различных комбинаторов с фиксированной точкой. Возможно, люди просто играли с комбинаторами, пока не наткнулись на них.
Юваль Фильмус

@YuvalFilmus, это то, что мое исследование и ответ на этот вопрос начинают заставлять меня задуматься. Но я все еще думаю, что было бы поучительно «увидеть», как комбинатор (ы) логически формируются, что особенно полезно при, например, попытке создать новый комбинатор.
BlueBomber

Прочитайте главу 9 в «Маленьком Лиспере» Даниэля П. Фридмана (или «Маленький интриган»)
user18199

2
ОП, кажется, указывает, что они уже прочитали это.
Рафаэль

Ответы:


29

Я нигде не читал это, но вот как я полагаю, мог быть получен:Y

Давайте иметь рекурсивную функцию , возможно, факториал или что-то еще в этом роде. Неформально мы определяем f как псевдо-лямбда-термин, где f встречается в его собственном определении:fff

f=ff

Во-первых, мы понимаем, что рекурсивный вызов может быть выделен как параметр:

f=(λr.(rr))Mf

Теперь мы могли бы определить если бы у нас был только способ передать его в качестве аргумента самому себе. Это невозможно, конечно, потому что у нас нет f под рукой. То , что мы имеем под рукой M . Поскольку M содержит все, что нам нужно для определения f , мы можем попытаться передать M в качестве аргумента вместо f и попытаться восстановить f из него позже внутри. Наша первая попытка выглядит так:ffMMfMff

f=(λr.(rr))M(λr.(rr))M

Однако это не совсем правильно. Перед тем , получили заменить г внутри М . Но теперь мы проходим М вместо. Мы должны как - то исправить все места , где мы используем г , чтобы они реконструкции п от М . На самом деле, это совсем не сложно: теперь, когда мы знаем, что f = M M , везде, где мы используем r, мы просто заменяем его на ( r r ) .еrMMrfMf=MMr(rr)

f=(λr.((rr)(rr)))M(λr.((rr)(rr)))M

Это решение хорошо, но нам пришлось изменить внутри. Это не очень удобно. Мы можем сделать это более элегантно, не изменяя M , введя другой λ, который посылает M свой аргумент, примененный к самому себе: выражая M как λ x . М ( х х ) мы получаемMMλMMλx.M(xx)

f=(λx.(λr.(rr))M(xx))(λx.(λr.(rr))M(xx))

Таким образом, когда заменяется на x , M M заменяется на r , который по определению равен f . Это дает нам нерекурсивное определение f , выраженное как действительный лямбда-членMxMMrff

Переход на теперь легкий. Мы можем взять произвольный лямбда-член вместо M и выполнить эту процедуру для него. Таким образом, мы можем выделить М и определитьYMM

Y=λm.(λx.m(xx))(λx.m(xx))

Действительно, сводится к f, как мы его определили.YMf


Примечание: я получил как это определено в литературе. Комбинатор вы описали это вариант Y для вызова по значению языков, иногда также называют Z . Смотрите эту статью в Википедии .YYZ


1
Отсутствующий но-казалось бы, очевидно , интуиция , что ваш отличный ответ дал мне, что рекурсивная функция должна себя в качестве аргумента, поэтому мы начнем с предположения , что функция будет иметь вид для некоторого X . Затем, когда мы создаем X , мы используем это утверждение, что f определяется как приложение чего-то к себе внутри X , например, применяя x к x в вашем ответе, который по определению равен f . Захватывающий! f=X(X)XXfXxxf
BlueBomber

11

Как отметил Ювал, не существует только одного оператора с фиксированной запятой. Их много. Другими словами, уравнение для теоремы о неподвижной точке не имеет единственного ответа. Таким образом, вы не можете извлечь оператора из них.

Это все равно что спрашивать, как люди выводят как решение для x = y . Они не! Уравнение не имеет единственного решения.(x,y)=(0,0)x=y


На тот случай, если вы хотите узнать, как была открыта первая теорема о неподвижной точке. Позвольте мне сказать, что я также задавался вопросом о том, как они придумали теоремы о фиксированной точке / рекурсии, когда я впервые увидел их. Это кажется таким гениальным. Особенно в форме теории вычислимости. В отличие от того, что говорит Ювал, это не тот случай, когда люди играют, пока не найдут что-то. Вот что я нашел:

Насколько я помню, теорема изначально принадлежит С. К. Клини. Клини предложила оригинальную теорему о фиксированной точке, спасая доказательство несостоятельности первоначального лямбда-исчисления Чёрча. Первоначальное лямбда-исчисление церкви пострадало от парадокса типа Рассела. Модифицированное лямбда-исчисление позволило избежать этой проблемы. Клини изучил доказательство несоответствия, вероятно, чтобы увидеть, как модифицированное лямбда-исчисление будет страдать от аналогичной проблемы, и превратил доказательство несоответствия в полезную теорему модифицированного лямбда-исчисления. Благодаря своей работе по эквивалентности исчисления лямбад с другими моделями вычислений (машинами Тьюринга, рекурсивными функциями и т. Д.) Он перенес его в другие модели вычислений.


Как вывести оператора вы можете спросить? Вот как я это запомнил. Теорема о неподвижной точке об удалении самоссылки.

Все знают парадокс лжеца:

Я логово.

Или в более лингвистической форме:

Это предложение неверно.

Теперь большинство людей думают, что проблема с этим предложением связана с самообращением. Нет! Самостоятельная ссылка может быть устранена (проблема с правдой, язык не может говорить об истинности своих собственных предложений вообще, см. Теорему Тарского о неопределимости истины ). Форма, в которой удалена собственная ссылка, выглядит следующим образом:

Если вы напишите следующую цитату дважды, во второй раз внутри кавычек, полученное предложение будет ложным: «Если вы напишите следующую цитату дважды, во второй раз внутри кавычек, полученное предложение будет ложным:»

Нет ссылки на себя, у нас есть инструкции о том, как создать предложение, а затем что-то с ним сделать. И построенное предложение равно инструкции. Обратите внимание, что в калькуляции нам не нужны кавычки, потому что нет различия между данными и инструкциями.λ

Теперь, если мы проанализируем это, у нас есть где M x - это инструкции, чтобы построить x x и что-то с ним сделать.MMMxxx

Mx=f(xx)

Итак, есть λ х . е ( х х ) и мы имеемMλx.f(xx)

MM=(λx.f(xx))(λx.f(xx))

Это для фиксированного . Если вы хотите сделать это оператором, мы просто добавим λ f и получим Y :fλfY

Y=λf.(MM)=λf.((λx.f(xx))(λx.f(xx)))

Так что я просто иметь в виду , парадокс без самоссылки , и это помогает мне понять , что о.Y


3

Таким образом, вам нужно определить комбинатор с фиксированной точкой

fix f = f (fix f)
      = f (f (fix f))
      = f (f (f ... ))

но без явной рекурсии. Начнем с самого простого неприводимого комбинатора

omega = (\x. x x) (\x. x x)
      = (\x. x x) (\x. x x)
      = ...

В xпервой лямбде многократно подставляется вторая лямбда. Простое альфа-преобразование делает этот процесс более понятным:

omega =  (\x. x x) (\x. x x)
      =α (\x. x x) (\y. y y)
      =β (\y. y y) (\y. y y)
      =α (\y. y y) (\z. z z)
      =β (\z. z z) (\z. z z)

Т.е. переменная в первой лямбде всегда исчезает. Так что, если мы добавим fк первой лямбда

(\x. f (x x)) (\y. y y)

fбудет всплывать

f ((\y. y y) (\y. y y))

Мы получили нашу omegaспину. Теперь должно быть ясно, что, если мы добавим a fко второй лямбде, то fпоявится в первой лямбде, а затем она подпрыгнет:

Y f = (\x. x x)     (\x. f (x x))
      (\x. f (x x)) (\x. f (x x)) -- the classical definition of Y

поскольку

(\x. s t) z = s ((\x. t) z), if `x' doesn't occur free in `s'

мы можем переписать выражение как

f ((\x. x x) (\x. f (x x))

который просто

f (Y f)

и мы получили наше уравнение Y f = f (Y f). Таким образом, Yкомбинатор по существу

  1. удвоить f
  2. сделать первый fподпрыгнул
  3. повторение

2

Возможно, вы видели классический пример уравнения без нормальной формы:

(λИкс,ИксИкс)(λИкс,ИксИкс)(λИкс,ИксИкс)(λИкс,ИксИкс)

Аналогичное уравнение предлагается для общей рекурсии:

(A)(λx.R(xx))(λx.R(xx)) R( (λx.R(xx))(λx.R(xx)) )R(R( (λx.R(xx))(λx.R(xx)) ))

Yf=f(Yf)fR

Yf=(λx.f(xx))(λx.f(xx))
Y=λf.(λx.f(xx))(λx.f(xx))
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.