Давайте начнем с обычной проблемы Монти Холла. Три двери, за одной из которых находится машина. У двух других есть козы позади них. Вы выбираете дверь № 1, и Монти открывает дверь № 2, чтобы показать вам, что за ней стоит коза. Стоит ли переключаться на дверь № 3? (Обратите внимание, что числа, которые мы используем для обозначения каждой двери, здесь не имеют значения. Мы можем выбрать любой порядок, и проблема та же, поэтому для упрощения мы можем просто использовать эту нумерацию.)
Ответ, конечно, да, как вы уже знаете, но давайте рассмотрим расчеты, чтобы увидеть, как они изменятся позже. Пусть будет индексом двери с автомобилем, а обозначает событие, которое Монти обнаружил, что в двери 2 есть коза. Нам нужно вычислить . Если это больше, чем , нам нужно переключить наше предположение на эту дверь (поскольку у нас есть только два оставшихся варианта). Эта вероятность определяется как:
(Это просто применение правила Байеса с плоской, предшествующей ). равно 1: если автомобиль находится за дверью № 3, то у Монти не было иного выбора, кроме как открыть дверь 2 как он сделал. CMp(C=3|M)1/2p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
Cp(M|C=3)p(M|C=1)1/2р(М|C=2)p(C=3|Mравно : если автомобиль находится за дверью 1, то у Монти был выбор, открыть одну из оставшихся дверей, 2 или 3. равно 0, потому что Монти никогда не открывает дверь, которую он знает, есть машина. Заполнив эти числа, мы получим:
этим результатом мы знакомы.1/2p(M|C=2)p(C=3|M)=10.5+0+1=23
Теперь давайте рассмотрим случай, когда Монти не знает, в какую дверь входит автомобиль. Поэтому, когда он выбирает свою дверь (которую мы будем продолжать называть дверью № 2), он может случайно выбрать ту, у которой есть машина, потому что он думает, что у нее есть коза. Пусть будет дверью, которую, по мнению Монти, имеет автомобиль, и пусть будет вероятностью того, что он думает, что автомобиль находится в определенном месте, в зависимости от его фактического местоположения. Предположим, что это описывается одним параметром который определяет его точность, такой что: . Если равно 1, Монти всегда прав. ЕслиC′ р ( С ' | С ) д р ( С ' = х | С = х ) = д = 1 - р ( С ' ≠ х | С = х ) д д д 1 / 3p(C′|C)qp(C′=x|C=x)=q=1−p(C′≠x|C=x)qq0, Монти всегда неправ (что все еще информативно). Если равно , информация Монти не лучше случайного угадывания.q1/3
Это означает, что теперь мы имеем:
p(M|C=3)=∑xp(M|C′=x)p(C′=x|C=3)
=p(M|C′=1)p(C′=1|C=3)+p(M|C′=2)p(C′=2|C=3)+p(M|C′=3)p(C′=3|C=3)
=12×12(1−q)+0×12(1−q)+1×q
=14−q4+q=34q+14
То есть, если автомобиль действительно находился за дверью 3, было три варианта, которые могли бы быть разыграны: (1) Монти подумал, что он позади 1, (2) Монти подумал 2 или (3) Монти подумал 3. Последний вариант имеет место с вероятностью (как часто он делает это правильно), два других делят вероятность того, что он делает это неправильно между ними. Затем, учитывая каждый сценарий, какова вероятность того, что он выбрал бы указать на дверь № 2, как он это сделал? Если бы он думал, что автомобиль был позади 1, эта вероятность была бы 1 в 2, поскольку он мог бы выбрать 2 или 3. Если бы он думал, что это было позади 2, он никогда бы не выбрал точку 2. Если бы он думал, что это было позади 3 Он всегда выбрал бы 2.q(1−q)
Мы можем аналогичным образом определить оставшиеся вероятности:
p(M|C=1)=∑xp(M|C′=x)p(C′=x|C=1)
=12×q+1×12(1−q)
=q2+12−q2=12
p(M|C=2)=∑xp(M|C′=x)p(C′=x|C=2)
=12×12(1−q)+1×12(1−q)
=34−34q
Заполнив все это, мы получим:
для проверки , когда , мы видим, что мы возвращаем наш первоначальный ответ .p(C=3|M)=34q+1412+34−34q+34q+14
=0.75q+0.251.5
q=111.5=23
Итак, когда мы должны перейти? Я для простоты предположу, что нам не разрешено переключаться на дверь, на которую указал Монти. И на самом деле, до тех пор, пока Монти, по крайней мере, в некоторой степени правдоподобен (в большей степени, чем случайные догадки), дверь, на которую он указывает, всегда будет меньше, чем у других, иметь машину, так что это нереальный вариант. для нас все равно. Таким образом, нам нужно учитывать только вероятности дверей 1 и 3. Но если раньше автомобиль не мог находиться за дверью 2, теперь этот вариант имеет ненулевую вероятность, и поэтому мы больше не должны переключаться когда , но лучше переключаться, когда (что раньше было то же самое). Эта вероятность определяется какp(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13Так же, как в оригинальной задаче Монти Холла. (Это имеет смысл, поскольку Монти никогда не может указывать на дверь 1, независимо от того, что находится за ней, и поэтому он не может предоставить информацию об этой двери. Скорее, когда его точность падает ниже 100%, эффект заключается в том, что некоторая вероятность «просачивается» к двери 2 фактически имеет машину.) Итак, нам нужно найти такой, что :
qp(C=3|M)>130.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
В общем, это был очень многословный способ выяснить, что, поскольку знания Монти об истинном местоположении автомобиля лучше, чем случайное предположение, вы должны поменять двери (что на самом деле довольно очевидно, когда вы об этом думаете ). Мы также можем рассчитать, насколько более вероятно, что мы выиграем при переходе, в зависимости от точности Монти, поскольку это определяется как:
(что, когда , дает ответ 2, что соответствует тому факту, что мы удваиваем наши шансы на победу, поменяв двери в первоначальной задаче Монти Холла.)p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1
Редактировать: Люди спрашивали о сценарии, где нам разрешено переключаться на дверь, на которую указывает Монти, что становится выгодным, когда , то есть когда Монти является (несколько) надежным "лжецом". В самом экстремальном сценарии, когда , это означает, что дверь, которую, по мнению Монти, в машине наверняка есть коза. Заметьте, однако, что в оставшихся двух дверях все еще может быть либо машина, либо коза.q<13q=0
Преимущество перехода к двери 2 определяется следующим образом:
который больше 1 (и, следовательно, стоит перейти к этой двери), если , т. е. если , который мы уже установлен был переломный момент. Интересно, что максимально возможное преимущество при переходе к двери 2, когда , составляет всего 1,5, по сравнению с удвоением ваших шансов на выигрыш в исходной задаче Монти Холла (когда ).p(C=2|M)p(C=1|M)=0.75−0.75q1.513=1.5−1.5q
1.5q<0.5q<13q=0q=1
Общее решение дается путем объединения этих двух стратегий переключения: когда , вы всегда переключаетесь на дверь 3; в противном случае переключитесь на дверь 2. q>13