Ставка Блэквелла


12

Я читал о парадоксе ставок Блэквелла на шкафу Futility . Вот резюме: вам представлены два конверта, и . Конверты содержат случайную сумму денег, но вы ничего не знаете о распределении денег. Вы открываете один, проверяете, сколько денег там ( ), и вам нужно выбрать: взять конверт или ?E y x E x E yExEyxExEy

«Бесполезный шкаф» относится к математику по имени Леонард Вапнер: «Неожиданно, есть кое-что, что вы можете сделать, кроме открытия другого конверта, чтобы дать себе больше, чем даже шанс сделать это правильно».

Идея, которая мне кажется неправильной, заключается в следующем: выбрать случайное число . Если , возьмите . Если , выберите .d < x E x d > x E ydd<xExd>xEy

Вапнер: «Если d находится между x и y, то ваш прогноз (как указано d) гарантированно будет верным. Предположим, что это происходит с вероятностью p. Если d падает меньше, чем x и y, то ваш прогноз будет верным только в том случае, если выбранное вами число x будет больше из двух. Существует 50-процентная вероятность этого. Точно так же, если d больше обоих чисел, ваш прогноз будет верным, только если выбранное вами число будет меньшим из двух. Это также происходит с вероятностью 50% ».

Если вероятность того, что находится в , больше нуля, то средний успех этого метода составляет . Это будет означать, что наблюдение несвязанной случайной величины дает нам дополнительную информацию.[ х , у ] 1d[x,y]12+p2

Я думаю, что все это неправильно, и что проблема заключается в выборе случайного целого числа. Что это означает? Как, любое целое число? В этом случае вероятность что лежит между и равна нулю, потому что и конечны.д х у х уpdxyxy

Если мы говорим, что существует ограничение на максимальную сумму денег, скажем, , или, по крайней мере, мы выбираем d из , то рецепт сводится к тривиальному совету выбора если и выбирая если .1 ... M E y x < M / 2 E x x > M / 2M1...MEyx<M/2Exx>M/2

Я что-то здесь скучаю?

РЕДАКТИРОВАТЬ

Хорошо, теперь я начинаю видеть, откуда возникает очевидный парадокс. Мне казалось невозможным, что несвязанная случайная величина может предоставить дополнительную информацию.

Однако обратите внимание, что нам нужно сознательно выбрать распределение d . Например, выберите границы для равномерного распределения, или распределения Poissionian и т. Д. Очевидно, если мы играем за арахис, и мы выбрали распределение d, чтобы быть равномерным на долларов, . Эта последняя вероятность будет зависеть в первую очередь от нашего суждения о том, что может быть в конвертах.[ 10 9 , 2 10 9 ] P ( d ( x , y ) ) = 0λ[109,2109]P(d(x,y))=0

Другими словами, если метод работает, то предположение, что мы не знаем, каково распределение денег в конвертах (как было выбрано количество денег для конвертов), нарушается. Однако, если мы действительно не знаем, что находится в конвертах, то в худшем случае мы ничего не потеряем, применяя это.

РЕДАКТИРОВАТЬ 2

Еще одна мысль. Для данного для рисования выберем непрерывное неотрицательное распределение, такое что . Нам разрешено это делать, я прав? Мы действуем в соответствии с инструкциями - если , мы сохраняем конверт, если , мы меняем конверт. Рассуждения не меняются, в зависимости от того, как мы выбираем распределение, может быть, что (или я ошибаюсь?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Однако, учитывая, как мы выбрали распределение, то, что мы сейчас делаем, эквивалентно броску монеты. Мы бросаем монету, и если это головы, мы меняем конверты, если это хвосты, мы придерживаемся конверта, который мы держим. Где я не прав?

РЕДАКТИРОВАТЬ 3 :

Хорошо, теперь я понял. Если мы основываем функцию вероятности на (например, мы выбираем из равномерного распределения в диапазоне , то вероятность не зависит от .х д ( 1 , 2 х ) Р ( д ( х , у ) ) Р ( правильное решение | д ( х , у ) )dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Итак, если (с вероятностью ), предположение всегда верно, как и раньше. Однако, если - меньшее число, а , то имеет больше шансов быть меньше, чем чем быть выше, чем , поэтому мы склонны к неверному решению. Те же рассуждения применимы, когда является более высоким из двух чисел.p x d ( x , y ) d x x xd(x,y)pxd(x,y)dxxx

Это означает, что мы должны выбрать процесс рисования независимо от . Другими словами, нам нужно угадать параметры распределения, из которых взяты и ; самое худшее, что происходит, - это то, что мы все еще догадываемся случайным образом, но лучше всего то, что наше предположение было верным - и тогда у нас есть преимущество Как это должно быть лучше, чем угадывать: «х и у, я думаю, будут не менее 1 $ , но не более 10 $ , поэтому, если , мы сохраняем его, а если нет, мы обмениваем его», я пока видеть.х х у х > 5dxxyx>5

Я был введен в заблуждение научно-популярной формулировкой проблемы в книге Вапнера (« Неожиданные ожидания. Любопытство математического хрустального шара» ), в которой говорится

«Каким-либо образом выберите случайное положительное целое число» (Вапнер предлагает геометрическое распределение - подбрасывание монет до появления первых голов, повторяя процесс, если ) «Если угадать выше и если угадать ниже. (...) Вы будете правильно угадывать более 50 процентов времени, потому что указывает правильно более 50 процентов времени! "д > х д < х дd=xd>xd<xd


1
Очень тесно связаны: stats.stackexchange.com/questions/95694
whuber

2
Это сильно отличается от проблемы двух конвертов в том смысле, что: (1) аргумент, приведенный для переключения в проблеме двух конвертов, ошибочен, недостаток в аргументе можно увидеть, добавив байесовский априор, в то время как (2) аргумент данная Вапнером ставка Блеквелла верна.
Мэтью Ганн

Если суммы денег в конвертах являются произвольными элементами набора чисел S, достаточным и необходимым условием для стратегии Вапнера является то, чтобы CDF числа, которое вы решаете строго увеличивать на S.
Восстановите Монику

Хорошо, я все еще что-то упускаю - пожалуйста, посмотрите мой РЕДАКТИРОВАТЬ 2, но мне кажется, что мы могли бы просто бросить монетку, и она все еще должна работать, в соответствии с рассуждениями. Где я не прав?
январь

Ответы:


8

Это более широко известно как проблема двух конвертов . Чаще всего суммы указаны как и 2 A, но это не обязательно так.A2A

Некоторые моменты:

  1. Вы не можете выбрать случайное целое число равномерно *, но цитируемая часть не требует, чтобы оно было равномерным. Выберите распределение - не имеет значения, что это за аргумент - если он имеет некоторую вероятность превышения любого конечного значения.

  2. Было бы бессмысленно выбирать integer в цитируемом правиле принятия решений, потому что деньги дискретны, что означает ненулевой шанс d = x, и для этого случая ничего не указано. (Или же, чтобы изменить правило, чтобы указать, что делать, когда они равны)d d=x

  3. Оставляя это в стороне, вы можете выбрать из некоторого неотрицательного непрерывного распределения - тогда нам не нужно беспокоиться о равенстве.d

* (и вы не можете выбрать равномерно случайное неотрицательное целое число или равномерно случайное положительное целое число)


Md1...MEyx<M/2Exx>M/2

xM/2

Тем не менее, версия этой игры, с которой я впервые познакомился, заключается в том, что конверт представляет тот, кто (возможно) стремится минимизировать ваш доход от игры. Стратегия использования дистрибутива, чтобы решить, переключаться ли на другой конверт, все еще будет работать в этом случае.


dP(d<x)=P(d>x)

P(d<x)=P(d>x)

d

превращая свою стратегию в функцию x, вы не даете себе возможности сделать правильный выбор, когда d находится между x и y, - вы определяете свой путь к победе в игре. Если ссылка, которую вы даете, утверждает, что такая стратегия сработает, они будут ошибаться
Glen_b

dxP(d(x,y))>0x(1,2x)d(x,y)
январь

7

Аргумент Вапнера верен!

Некоторые комментарии:

  • x<dd
  • d
  • В определенных ситуациях (например, когда чем больше вы наблюдаете, тем более вероятно, что вы получили большой конверт), стратегия отсечения даже оптимальна.
  • В более общей байесовской обстановке вы можете добиться большего успеха, чем простая стратегия отсечения для многих приоров.

Связанная, но другая проблема:

Как уже упоминали несколько @Glen_b и @whuber, есть связанная загадка, известная как проблема двух конвертов, где дается ложный аргумент за постоянное переключение конвертов, и недостаток в аргументе можно увидеть, если применить байесовский подход и добавить предыдущие убеждения над содержимое двух конвертов.

В некотором смысле, описанная здесь головоломка несколько иная. Аргумент Вапнера верен!


1
Хорошо, теперь я вижу, откуда возникает парадокс. Или, если быть точным, где дополнительная информация поступает в систему. Сознательно выбирая распределение d , мы используем наши априорные знания о том, где, в большей или меньшей степени, должны быть суммы денег в обоих конвертах. В худшем случае наши знания бесполезны, но метод гарантирует, что мы не будем в невыгодном положении, если будем их использовать.
январь

После некоторой мысли я все еще не понимаю - см. РЕДАКТИРОВАТЬ 2.
Январь

1020dP(x<d)=P(x>d)

d=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10x=2,4,7,9

xyxdd

0

Я был заинтригован этим и принял прагматичный подход к игре в Excel.

Я сгенерировал три случайных числа для x, y и d в диапазоне 1-100. Затем я сделал сравнение между d и x и между x и y и посмотрел на результат, правильный или неправильный.

Я делал это 500 раз и повторял это несколько раз и регулярно получал правильный ответ около 330 из 500, как и предсказывалось.

Затем я увеличил диапазон d до 1-10000, и правильный ответ упал примерно до 260 для 500 прогонов.

Так что да, выбор d зависит от ожидаемых значений x и y.

BoB


0

Я думаю, что очевидный парадокс с расширением Вапнера уравнения p + (1-p) / 2 состоит в том, что он предполагает, что (1-p) / 2> 0. Для многих диапазонов d это значение равно 0.

Например: любой d, выбранный из симметричного распределения с центром в значении в открытой оболочке, дает вероятность неправильного 1/2 и правильного 1/2.

Любое асимметрично выбранное распределение, кажется, смещает выбор неверным образом в 1/2 раза.

Так есть ли способ выбрать диапазон и распределение для d, чтобы это уравнение выполнялось?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.