Ставка Блэквелла

12

Я читал о парадоксе ставок Блэквелла на шкафу Futility . Вот резюме: вам представлены два конверта, и . Конверты содержат случайную сумму денег, но вы ничего не знаете о распределении денег. Вы открываете один, проверяете, сколько денег там ( ), и вам нужно выбрать: взять конверт или ? $E_x$ $E_y$ $x$ $E_x$ $E_y$

«Бесполезный шкаф» относится к математику по имени Леонард Вапнер: «Неожиданно, есть кое-что, что вы можете сделать, кроме открытия другого конверта, чтобы дать себе больше, чем даже шанс сделать это правильно».

Идея, которая мне кажется неправильной, заключается в следующем: выбрать случайное число . Если , возьмите . Если , выберите . $d$ $d < x$ $E_x$ $d > x$ $E_y$

Вапнер: «Если d находится между x и y, то ваш прогноз (как указано d) гарантированно будет верным. Предположим, что это происходит с вероятностью p. Если d падает меньше, чем x и y, то ваш прогноз будет верным только в том случае, если выбранное вами число x будет больше из двух. Существует 50-процентная вероятность этого. Точно так же, если d больше обоих чисел, ваш прогноз будет верным, только если выбранное вами число будет меньшим из двух. Это также происходит с вероятностью 50% ».

Если вероятность того, что находится в , больше нуля, то средний успех этого метода составляет . Это будет означать, что наблюдение несвязанной случайной величины дает нам дополнительную информацию. $d$ $[x,y]$ $\frac{1}{2} + \frac{p}{2}$

Я думаю, что все это неправильно, и что проблема заключается в выборе случайного целого числа. Что это означает? Как, любое целое число? В этом случае вероятность что лежит между и равна нулю, потому что и конечны. $p$ $d$ $x$ $y$ $x$ $y$

Если мы говорим, что существует ограничение на максимальную сумму денег, скажем, , или, по крайней мере, мы выбираем d из , то рецепт сводится к тривиальному совету выбора если и выбирая если . $M$ $1...M$ $E_y$ $x < M/2$ $E_x$ $x > M/2$

Я что-то здесь скучаю?

РЕДАКТИРОВАТЬ

Хорошо, теперь я начинаю видеть, откуда возникает очевидный парадокс. Мне казалось невозможным, что несвязанная случайная величина может предоставить дополнительную информацию.

Однако обратите внимание, что нам нужно сознательно выбрать распределение d . Например, выберите границы для равномерного распределения, или распределения Poissionian и т. Д. Очевидно, если мы играем за арахис, и мы выбрали распределение d, чтобы быть равномерным на долларов, . Эта последняя вероятность будет зависеть в первую очередь от нашего суждения о том, что может быть в конвертах. $\lambda$ $[10^9, 2\cdot 10^9]$ $P(d \in (x,y)) = 0$

Другими словами, если метод работает, то предположение, что мы не знаем, каково распределение денег в конвертах (как было выбрано количество денег для конвертов), нарушается. Однако, если мы действительно не знаем, что находится в конвертах, то в худшем случае мы ничего не потеряем, применяя это.

РЕДАКТИРОВАТЬ 2

Еще одна мысль. Для данного для рисования выберем непрерывное неотрицательное распределение, такое что . Нам разрешено это делать, я прав? Мы действуем в соответствии с инструкциями - если , мы сохраняем конверт, если , мы меняем конверт. Рассуждения не меняются, в зависимости от того, как мы выбираем распределение, может быть, что (или я ошибаюсь?). $x$ $d$ $P(d < x) = P(d > x)$ $d < x$ $d > x$ $P(d \in [x, y]) > 0$

Однако, учитывая, как мы выбрали распределение, то, что мы сейчас делаем, эквивалентно броску монеты. Мы бросаем монету, и если это головы, мы меняем конверты, если это хвосты, мы придерживаемся конверта, который мы держим. Где я не прав?

РЕДАКТИРОВАТЬ 3 :

Хорошо, теперь я понял. Если мы основываем функцию вероятности на (например, мы выбираем из равномерного распределения в диапазоне , то вероятность не зависит от . $d$ $x$ $d$ $(1, 2 \cdot x)$ $P(d \in (x,y))$ $P(\text{correct decision}|d \notin (x,y))$

Итак, если (с вероятностью ), предположение всегда верно, как и раньше. Однако, если - меньшее число, а , то имеет больше шансов быть меньше, чем чем быть выше, чем , поэтому мы склонны к неверному решению. Те же рассуждения применимы, когда является более высоким из двух чисел. $d \in (x,y)$ $p$ $x$ $d \notin (x,y)$ $d$ $x$ $x$ $x$

Это означает, что мы должны выбрать процесс рисования независимо от . Другими словами, нам нужно угадать параметры распределения, из которых взяты и ; самое худшее, что происходит, - это то, что мы все еще догадываемся случайным образом, но лучше всего то, что наше предположение было верным - и тогда у нас есть преимущество Как это должно быть лучше, чем угадывать: «х и у, я думаю, будут не менее 1 $ , но не более 10 $ , поэтому, если , мы сохраняем его, а если нет, мы обмениваем его», я пока видеть. $d$ $x$ $x$ $y$ $x > 5$

Я был введен в заблуждение научно-популярной формулировкой проблемы в книге Вапнера (« Неожиданные ожидания. Любопытство математического хрустального шара» ), в которой говорится

«Каким-либо образом выберите случайное положительное целое число» (Вапнер предлагает геометрическое распределение - подбрасывание монет до появления первых голов, повторяя процесс, если ) «Если угадать выше и если угадать ниже. (...) Вы будете правильно угадывать более 50 процентов времени, потому что указывает правильно более 50 процентов времени! " $d=x$ $d > x$ $d < x$ $d$

probability paradox

— январь
источник

1

Очень тесно связаны: stats.stackexchange.com/questions/95694

— whuber

2

Это сильно отличается от проблемы двух конвертов в том смысле, что: (1) аргумент, приведенный для переключения в проблеме двух конвертов, ошибочен, недостаток в аргументе можно увидеть, добавив байесовский априор, в то время как (2) аргумент данная Вапнером ставка Блеквелла верна.

— Мэтью Ганн

Если суммы денег в конвертах являются произвольными элементами набора чисел S, достаточным и необходимым условием для стратегии Вапнера является то, чтобы CDF числа, которое вы решаете строго увеличивать на S.

— Восстановите Монику

Хорошо, я все еще что-то упускаю - пожалуйста, посмотрите мой РЕДАКТИРОВАТЬ 2, но мне кажется, что мы могли бы просто бросить монетку, и она все еще должна работать, в соответствии с рассуждениями. Где я не прав?

— январь

8

Это более широко известно как проблема двух конвертов . Чаще всего суммы указаны как и но это не обязательно так. $A$ $2A$

Некоторые моменты:

Вы не можете выбрать случайное целое число равномерно *, но цитируемая часть не требует, чтобы оно было равномерным. Выберите распределение - не имеет значения, что это за аргумент - если он имеет некоторую вероятность превышения любого конечного значения.
Было бы бессмысленно выбирать integer в цитируемом правиле принятия решений, потому что деньги дискретны, что означает ненулевой шанс и для этого случая ничего не указано. (Или же, чтобы изменить правило, чтобы указать, что делать, когда они равны) $d$ $d=x$
Оставляя это в стороне, вы можете выбрать из некоторого неотрицательного непрерывного распределения - тогда нам не нужно беспокоиться о равенстве. $d$

* (и вы не можете выбрать равномерно случайное неотрицательное целое число или равномерно случайное положительное целое число)

$M$ $d$ $1...M$ $E_y$ $x<M/2$ $E_x$ $x>M/2$

$x$ $M/2$

Тем не менее, версия этой игры, с которой я впервые познакомился, заключается в том, что конверт представляет тот, кто (возможно) стремится минимизировать ваш доход от игры. Стратегия использования дистрибутива, чтобы решить, переключаться ли на другой конверт, все еще будет работать в этом случае.

— Glen_b - Восстановить Монику
источник

d

$d$

P (d < x) = P (d > x)

$P(d < x) = P(d > x)$

P (d < x) = P (d > x)

$P(d<x)=P(d>x)$

d

$d$

превращая свою стратегию в функцию x, вы не даете себе возможности сделать правильный выбор, когда d находится между x и y, - вы определяете свой путь к победе в игре. Если ссылка, которую вы даете, утверждает, что такая стратегия сработает, они будут ошибаться

— Glen_b

d

$d$

x

$x$

P (d \in (x, y)) > 0

$P(d \in (x,y)) > 0$

x

$x$

(1, 2 \cdot x)

$(1, 2 \cdot x)$

d \in (x, y)

$d \in (x,y)$

— январь

7

Аргумент Вапнера верен!

Некоторые комментарии:

$x < d$ $d$
$d$
В определенных ситуациях (например, когда чем больше вы наблюдаете, тем более вероятно, что вы получили большой конверт), стратегия отсечения даже оптимальна.
В более общей байесовской обстановке вы можете добиться большего успеха, чем простая стратегия отсечения для многих приоров.

Связанная, но другая проблема:

Как уже упоминали несколько @Glen_b и @whuber, есть связанная загадка, известная как проблема двух конвертов, где дается ложный аргумент за постоянное переключение конвертов, и недостаток в аргументе можно увидеть, если применить байесовский подход и добавить предыдущие убеждения над содержимое двух конвертов.

В некотором смысле, описанная здесь головоломка несколько иная. Аргумент Вапнера верен!

— Мэтью Ганн
источник

1

Хорошо, теперь я вижу, откуда возникает парадокс. Или, если быть точным, где дополнительная информация поступает в систему. Сознательно выбирая распределение d , мы используем наши априорные знания о том, где, в большей или меньшей степени, должны быть суммы денег в обоих конвертах. В худшем случае наши знания бесполезны, но метод гарантирует, что мы не будем в невыгодном положении, если будем их использовать.

— январь

После некоторой мысли я все еще не понимаю - см. РЕДАКТИРОВАТЬ 2.

— Январь

10

$10$

20

$20$

d

$d$

P (x < d) = P (x > d)

$P(x < d) = P(x > d)$

d = 5.5

$d = 5.5$

P (x < d) = P (x > d)

$P(x<d) = P(x > d)$

< 5.5

$< 5.5$

x = 1, 3, 5, 6, 8,

$x = 1, 3, 5, 6, 8,$

10

$10$

x = 2, 4, 7, 9

$x = 2, 4, 7, 9$

x

$x$

y

$y$

x

$x$

d

$d$

d

$d$

0

Я был заинтригован этим и принял прагматичный подход к игре в Excel.

Я сгенерировал три случайных числа для x, y и d в диапазоне 1-100. Затем я сделал сравнение между d и x и между x и y и посмотрел на результат, правильный или неправильный.

Я делал это 500 раз и повторял это несколько раз и регулярно получал правильный ответ около 330 из 500, как и предсказывалось.

Затем я увеличил диапазон d до 1-10000, и правильный ответ упал примерно до 260 для 500 прогонов.

Так что да, выбор d зависит от ожидаемых значений x и y.

BoB

— user121909
источник

0

Я думаю, что очевидный парадокс с расширением Вапнера уравнения p + (1-p) / 2 состоит в том, что он предполагает, что (1-p) / 2> 0. Для многих диапазонов d это значение равно 0.

Например: любой d, выбранный из симметричного распределения с центром в значении в открытой оболочке, дает вероятность неправильного 1/2 и правильного 1/2.

Любое асимметрично выбранное распределение, кажется, смещает выбор неверным образом в 1/2 раза.

Так есть ли способ выбрать диапазон и распределение для d, чтобы это уравнение выполнялось?

— Терри
источник