Проблема Монти Холла с ошибочным Монти


23

Монти прекрасно знал, была ли за дверью коза (или она была пуста). Этот факт позволяет игроку удвоить свой показатель успеха с течением времени, переключая «догадки» на другую дверь. Что если знания Монти были не идеальными? Что если иногда приз действительно находился в том же дверном проеме, что и коза? Но вы не могли этого увидеть, пока не выбрали и не открыли СВОЮ дверь? Можете ли вы помочь мне понять, как рассчитать ЕСЛИ - и насколько - игрок может улучшить свой успех, когда показатель точности Монти составляет менее 100%? Например: что если Монти не прав - в среднем 50% времени? Может ли Игрок ВСЕГДА получить выгоду от переключения его Угадай / Двери? Я полагаю, что если у Монти меньше 33,3% шансов на то, что Приз НЕ находится за дверью, лучший вариант для игрока - НЕ переключать свою дверь. Не могли бы вы дать мне способ подсчитать потенциальную выгоду от переключения, указав различные вероятности того, что Монти будет прав, если приз не находится за дверью? У меня нет ничего, кроме математики в средней школе, и мне 69 лет, поэтому, пожалуйста, будьте нежны.


Спасибо за предоставленные идеи и формулы. Похоже, что если «Падший Монти» точно предсказывает отсутствие Приза / Автомобиля только на 66%, то выигрыш НУЛЯ будет выгоден при переходе от вашего первоначального выбора дверей… потому что его коэффициент ошибок 33% является значением по умолчанию Базовая ставка за приз находится за ЛЮБОЙ дверью. Однако предполагается, что если Монти становится лучше, чем 66%, предсказывая, где НЕТ ПРИЗА, то переключение дает большую полезность. Я попытаюсь применить это рассуждение к игре, в которой «Эксперт» делает «экспертный прогноз», что один из трех примерно одинаково вероятных вариантов будет правильным. Я мало верю в то, что Эксперт прав, и я совершенно уверен, что его «коэффициент попадания» будет меньше 33% - больше как 15%. Мой вывод из этого будет то, что когдатот же вариант, что и у меня, я наверняка ошибаюсь, и должен измениться на один из двух других! ;-)


5
Если точность Монти меньше 100%, значит ли это, что он иногда открывает дверь с призом за ней? Если это так, вам, вероятно, следует выбрать эту дверь.
Факс

Ответы:


35

Давайте начнем с обычной проблемы Монти Холла. Три двери, за одной из которых находится машина. У двух других есть козы позади них. Вы выбираете дверь № 1, и Монти открывает дверь № 2, чтобы показать вам, что за ней стоит коза. Стоит ли переключаться на дверь № 3? (Обратите внимание, что числа, которые мы используем для обозначения каждой двери, здесь не имеют значения. Мы можем выбрать любой порядок, и проблема та же, поэтому для упрощения мы можем просто использовать эту нумерацию.)

Ответ, конечно, да, как вы уже знаете, но давайте рассмотрим расчеты, чтобы увидеть, как они изменятся позже. Пусть будет индексом двери с автомобилем, а обозначает событие, которое Монти обнаружил, что в двери 2 есть коза. Нам нужно вычислить . Если это больше, чем , нам нужно переключить наше предположение на эту дверь (поскольку у нас есть только два оставшихся варианта). Эта вероятность определяется как: (Это просто применение правила Байеса с плоской, предшествующей ). равно 1: если автомобиль находится за дверью № 3, то у Монти не было иного выбора, кроме как открыть дверь 2 как он сделал. CMp(C=3|M)1/2

p(C=3|M)=p(M|C=3)p(M|C=1)+p(M|C=2)+p(M|C=3)
Cp(M|C=3)p(M|C=1)1/2р(М|C=2)p(C=3|Mравно : если автомобиль находится за дверью 1, то у Монти был выбор, открыть одну из оставшихся дверей, 2 или 3. равно 0, потому что Монти никогда не открывает дверь, которую он знает, есть машина. Заполнив эти числа, мы получим: этим результатом мы знакомы.1/2p(M|C=2)
p(C=3|M)=10.5+0+1=23

Теперь давайте рассмотрим случай, когда Монти не знает, в какую дверь входит автомобиль. Поэтому, когда он выбирает свою дверь (которую мы будем продолжать называть дверью № 2), он может случайно выбрать ту, у которой есть машина, потому что он думает, что у нее есть коза. Пусть будет дверью, которую, по мнению Монти, имеет автомобиль, и пусть будет вероятностью того, что он думает, что автомобиль находится в определенном месте, в зависимости от его фактического местоположения. Предположим, что это описывается одним параметром который определяет его точность, такой что: . Если равно 1, Монти всегда прав. ЕслиC р ( С ' | С ) д р ( С ' = х | С = х ) = д = 1 - р ( С 'х | С = х ) д д д 1 / 3p(C|C)qp(C=x|C=x)=q=1p(Cx|C=x)qq0, Монти всегда неправ (что все еще информативно). Если равно , информация Монти не лучше случайного угадывания.q1/3

Это означает, что теперь мы имеем:

p(M|C=3)=xp(M|C=x)p(C=x|C=3)
=p(M|C=1)p(C=1|C=3)+p(M|C=2)p(C=2|C=3)+p(M|C=3)p(C=3|C=3)
=12×12(1q)+0×12(1q)+1×q
=14q4+q=34q+14

То есть, если автомобиль действительно находился за дверью 3, было три варианта, которые могли бы быть разыграны: (1) Монти подумал, что он позади 1, (2) Монти подумал 2 или (3) Монти подумал 3. Последний вариант имеет место с вероятностью (как часто он делает это правильно), два других делят вероятность того, что он делает это неправильно между ними. Затем, учитывая каждый сценарий, какова вероятность того, что он выбрал бы указать на дверь № 2, как он это сделал? Если бы он думал, что автомобиль был позади 1, эта вероятность была бы 1 в 2, поскольку он мог бы выбрать 2 или 3. Если бы он думал, что это было позади 2, он никогда бы не выбрал точку 2. Если бы он думал, что это было позади 3 Он всегда выбрал бы 2.q(1q)

Мы можем аналогичным образом определить оставшиеся вероятности:

p(M|C=1)=xp(M|C=x)p(C=x|C=1)
=12×q+1×12(1q)
=q2+12q2=12

p(M|C=2)=xp(M|C=x)p(C=x|C=2)
=12×12(1q)+1×12(1q)
=3434q

Заполнив все это, мы получим: для проверки , когда , мы видим, что мы возвращаем наш первоначальный ответ .

p(C=3|M)=34q+1412+3434q+34q+14
=0.75q+0.251.5
q=111.5=23

Итак, когда мы должны перейти? Я для простоты предположу, что нам не разрешено переключаться на дверь, на которую указал Монти. И на самом деле, до тех пор, пока Монти, по крайней мере, в некоторой степени правдоподобен (в большей степени, чем случайные догадки), дверь, на которую он указывает, всегда будет меньше, чем у других, иметь машину, так что это нереальный вариант. для нас все равно. Таким образом, нам нужно учитывать только вероятности дверей 1 и 3. Но если раньше автомобиль не мог находиться за дверью 2, теперь этот вариант имеет ненулевую вероятность, и поэтому мы больше не должны переключаться когда , но лучше переключаться, когда (что раньше было то же самое). Эта вероятность определяется какp(C=3|M)>0.5p(C=3|M)>p(C=1|M)p(C=1|M)=0.51.5=13Так же, как в оригинальной задаче Монти Холла. (Это имеет смысл, поскольку Монти никогда не может указывать на дверь 1, независимо от того, что находится за ней, и поэтому он не может предоставить информацию об этой двери. Скорее, когда его точность падает ниже 100%, эффект заключается в том, что некоторая вероятность «просачивается» к двери 2 фактически имеет машину.) Итак, нам нужно найти такой, что : qp(C=3|M)>13

0.75q+0.251.5>13
0.75q+0.25>0.5
0.75q>0.25
q>13
В общем, это был очень многословный способ выяснить, что, поскольку знания Монти об истинном местоположении автомобиля лучше, чем случайное предположение, вы должны поменять двери (что на самом деле довольно очевидно, когда вы об этом думаете ). Мы также можем рассчитать, насколько более вероятно, что мы выиграем при переходе, в зависимости от точности Монти, поскольку это определяется как: (что, когда , дает ответ 2, что соответствует тому факту, что мы удваиваем наши шансы на победу, поменяв двери в первоначальной задаче Монти Холла.)
p(C=3|M)p(C=1|M)
=0.75q+0.251.513=1.5q+0.5
q=1

Редактировать: Люди спрашивали о сценарии, где нам разрешено переключаться на дверь, на которую указывает Монти, что становится выгодным, когда , то есть когда Монти является (несколько) надежным "лжецом". В самом экстремальном сценарии, когда , это означает, что дверь, которую, по мнению Монти, в машине наверняка есть коза. Заметьте, однако, что в оставшихся двух дверях все еще может быть либо машина, либо коза.q<13q=0

Преимущество перехода к двери 2 определяется следующим образом: который больше 1 (и, следовательно, стоит перейти к этой двери), если , т. е. если , который мы уже установлен был переломный момент. Интересно, что максимально возможное преимущество при переходе к двери 2, когда , составляет всего 1,5, по сравнению с удвоением ваших шансов на выигрыш в исходной задаче Монти Холла (когда ).

p(C=2|M)p(C=1|M)=0.750.75q1.513=1.51.5q
1.5q<0.5q<13q=0q=1

Общее решение дается путем объединения этих двух стратегий переключения: когда , вы всегда переключаетесь на дверь 3; в противном случае переключитесь на дверь 2. q>13


Не повысится ли ожидаемое значение на самом деле, когда q < 1/3, потому что это не моделирует, насколько он вероятен быть точным, это моделирует, насколько вероятно, что он ошибается? Когда он приблизится к 0, это будет означать, что он всегда лжет, если может, и ваш ожидаемый выигрыш вернется к 2/3
Cireo

2
@ Cireo Он не будет лгать, он просто ошибется. Ложь подразумевает, что он знает, что его ответ был неправильным. Я подозреваю, что причина, по которой ожидаемое значение не повышается, заключается в том, что вероятность того, что он случайно укажет на дверь с автомобилем за ней (т. Е. P (M | C = 2) повышается), и вы не можете выбрать та дверь, несмотря ни на что). q = 0 означает, что он всегда неверно запоминает, где находится машина, то есть теперь у него относительно высокий шанс, чтобы он указал на дверь, а за ней машина.
Буурман

3
Более общее решение (которое очевидно необходимо) включает в себя «враждебного» Монти; тот, кто меняет то, на что он указывает (или даже если он указывает на что-то), в зависимости от того, выбрали ли вы козу или машину.
Якк

3
@Yakk: Есть бесконечно много других сценариев, которые вы можете себе представить, которые изменяют шансы бесконечно многими способами. Все также зависит от того, знаете ли вы, как работает Монти. Если вы знаете, что он враждебен, то на самом деле он не сможет уменьшить ваши шансы ниже 1/3, потому что вы просто решите игнорировать то, что он делает. Если вы не знаете его процесса принятия решений, то это полностью зависит от того, что вы предполагаете и что он делает точно, и там есть много степеней свободы.
Рубен ван Берген

1
@KalevMaricq: Я действительно не говорил о лжи Монти. Проблема в том, что машина может быть за дверью, которую вы изначально выбрали, которую Монти не может выбрать (в противном случае, я бы сказал, что это больше не проблема Монти Холла). Таким образом, у него может быть только две двери для коз, которые он может выбрать, и в этом случае он не может лгать, говоря, что за одной из них стоит коза. Так что я не думаю, что возможно построить истинного «лжеца Монти» в рамках проблемы. Вместо этого я использовал (для ) Монти, который всегда принимает дверцу козла за дверцу машины, но мы не знаем, какая дверь козла. q=0
Рубен ван Берген

7

Это должна быть довольно простая вариация проблемы (хотя я отмечаю ваш ограниченный математический фон, поэтому я предполагаю, что это относительно). Я бы посоветовал вам сначала попытаться определить решение, зависящее от того, является ли Монте безошибочным или полностью ошибочным. Первый случай - это обычная проблема Монте-Холла, поэтому никакой работы там не требуется. Во втором случае вы рассматриваете дверь, которую он выбирает, как случайную по всем дверям, включая дверь с призом (то есть он может по-прежнему выбирать дверь без приза, но теперь это случайно). Если вы можете рассчитать вероятность выигрыша в каждом из этих случаев, то вы используете закон полной вероятности определить соответствующие вероятности выигрыша в случае, когда у Монте есть некоторый определенный уровень погрешности (определяемый вероятностью того, что мы непогрешимы по сравнению с полностью ошибочными).


2
Я ценю ответ, но я искал что-то более конкретное. Я уточняю, что Монти выбрал дверь. Я уточняю, что вероятность того, что приз окажется за этой дверью, может быть от нуля до 100%. Я надеялся на формулу, которая позволила бы мне просто ввести Вероятность того, что Монти прав / неправ, а затем разработка остальной части формулы предоставила бы Числовую Оценку, которая указывает Вероятность того, что Переключение приведет к победе. Является ли эта степень помощи нереальным запросом?
Псевдоего

4

Основываясь на комментариях к ответу Бена, я собираюсь предложить две разные интерпретации этого варианта Монти Холла, в отличие от Рубена ван Бергена.

Первого я назову лжецом Монти, а второго ненадежным Монти. В обеих версиях проблема происходит следующим образом:

(0) Есть три двери, за одной из которых находится машина, а за двумя другими - козы, распределенные случайным образом.

(1) Участник выбирает дверь наугад.

(2) Монти выбирает дверь, отличную от двери участника, и утверждает, что за ней стоит коза.

(3) Участнику предлагается переключиться на третью незакрытую дверь, и проблема в том, «Когда участник должен переключиться, чтобы максимизировать вероятность обнаружения автомобиля за дверью?»

В лжеце Монти, на этапе (2), если участник выбрал дверь, содержащую козу, Монти выбирает дверь, содержащую автомобиль, с некоторой предопределенной вероятностью (т. Е. Существует вероятность от 0 до 100%, что он будет лгать, что козел за какой-то дверью). Обратите внимание, что в этом варианте Монти никогда не выбирает дверь, содержащую автомобиль (т.е. не может лгать), если участник выбрал автомобиль на шаге (1).

2313

Чтобы ответить на проблему, нам нужно использовать некоторые уравнения. Я постараюсь сформулировать свой ответ так, чтобы он был доступен. Две вещи, которые, я надеюсь, не слишком смущают, это алгебраическое манипулирование символами и условная вероятность. Для первого мы будем использовать символы для обозначения следующего:

S=The car is behind the door the contestant can switch to.S¯=The car is not behind the door the contestant can switch to.M=The car is behind the door Monty chose.M¯=The car is not behind the door Monty chose.C=The car is behind the door the contestant chose in step (1).C¯=The car is not behind the door the contestant chose in step (1).

Pr()Pr(M¯)

Pr(S|M¯)|Pr(S|M¯)Pr(S|M¯)=23Pr(S)=13

Pr(M|C¯)Pr(M) Pr(M and C¯)=Pr(C¯|M)Pr(M)=Pr(M|C¯)Pr(C¯)

Pr(M)=Pr(M|C¯)Pr(C¯)Pr(C¯|M)32Pr(M)=Pr(M|C¯),
Pr(C¯)23Pr(C¯|M)

23

Pr(S)

Pr(S)=Pr(S|C)Pr(C)+Pr(S|C¯ and M)Pr(C¯ and M)+Pr(S|C¯ and M¯)Pr(C¯ and M¯)=Pr(C¯ and M¯)
Pr(S|C)=Pr(S|C¯ and M)=0Pr(S|C¯ and M¯)=1

Продолжение:

Pr(S)=Pr(C¯ and M¯)=Pr(M¯|C¯)Pr(C¯)=2323Pr(M|C¯))

So you see, when Monty always lies (aka Pr(M|C¯))=1) then you have a zero chance of winning if you always switch, and if he never lies then the probability the car is behind the door you can switch to, Pr(S), is 23.

From this you can work out the optimal strategies for both Liar, and Unreliable Monty.

Addendum 1

In response to comment (emphasis mine):

"I added more details in my comment to @alex - Monty is never hostile nor devious, just FALLIBLE, as sometimes he can be wrong for whatever reasons, and never actually opens the door. Research shows that Monty is wrong roughly 33.3% of the time, and the car actually turns out to be there. That is a Posterior Probability of being correct 66.6% of the time, correct? Monty never chooses YOUR door, and you will never choose his. Do these assumptions change anything?"

This is as I understand, the Unreliable Monty Hall Problem introduced at the start of my answer.

Therefore, if Monty's door contains the car 13 of the time, we have the probability of winning when you switch to the last unpicked door as:

Pr(S)=2323Pr(M|C¯)=2323×32Pr(M)=2313=13

Thus, there is no difference between switching, remaining with the original door or if allowed, switching to Monty's chosen door (in line with your intuition.)


Alex and @Ruben van Bergen et al Thanks for the helpful details. Assume Monty's never hostile, just fallible and tells you "I am pretty sure that the the Car is NOT behind this door." but does not open the door. Let's assume Research shows he is WRONG only about 33.3% of the time, thus correct 66.6% (a Posterior Probability?). There is still some benefit to switching, but once his accuracy reaches only 33.3% then it would make NO sense to switch to either HIS door or the other one. Literally a case of "your guess is as good as mine." Does any of this change your Analyses or Formulae?
Pseudoego

No, this doesn't change my analysis. I added something which I hope clarifies the question in your comment. Btw, I wouldn't read too much into the words "hostile", "fallible", "monty lies". These don't really mean anything unless defined with precision as the (conditional) probability that Monty is wrong about a door containing a goat.
Alex

Pretty annoyed that my OWN answer to MY OWN question would be deleted with the only explanation given is that this site is not for "discussion" - when I am mainly explaining why I think the Answers given so far are Correct, and explaining how they will be useful. There was far more discussion in most of the other answers given. This seems myopic to me - at best - and moronic - at worst - to delete somebody's answer to their own question: how can you possibly explain WHY you are rating an Answer as the BEST without discussing it? Thanks to all who replied regardless.
Pseudoego

@Pseudoego your last comment is better post as a comment on your original question. I didn't see your answer, but it sounds like you want to discuss the existing answers, in which case you can modify your original question.
Alex

0

For some reason, a moderator decided to delete my own answer to my own question, on the grounds that it contained "discussion." I don't really see HOW I can explain what is the Best Answer without discussing what makes it work for me, and how it can be applied in practice.

I appreciate the insights and formulae which were provided in the previous answers. It appears to be that IF "Fallible Monty" is only 66% accurate in predicting the absence of a Prize/Car THEN there is ZERO benefit to switching from your original choice of doors....because his 33% error rate is the default base rate for the Prize being behind ANY door. One assumes, though, that IF Monty gets better than 66% at predicting where there is NO PRIZE THEN switching derives greater Utility.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.