Чтобы максимизировать вероятность правильного угадывания результата броска монеты, должен ли я всегда выбирать наиболее вероятный результат?


20

Это не домашнее задание. Мне интересно понять, правильна ли моя логика в этой простой задаче статистики.

Допустим, у меня есть двусторонняя монета, в которой вероятность перевернуть голову равна а вероятность перевернуть хвост - . Давайте предположим, что все сальто имеют независимые вероятности. Теперь, скажем, я хочу максимально увеличить свои шансы предсказать, будет ли монета головой или хвостом на следующем броске. Если , я могу случайным образом угадать головы или хвосты, и вероятность того, что я прав, равна .1 - P ( H ) P ( H ) = 0,5 0,5P(H)1P(H)P(H)=0.50.5

Теперь предположим, что , если я хочу максимально увеличить свои шансы правильно угадать, должен ли я всегда угадывать хвосты, где вероятность равна ?P(H)=0.20.8

Сделав еще один шаг вперед, если бы у меня был 3-х сторонний кристалл, и вероятность броска 1, 2 или 3 была , и я должен всегда угадывать 2, чтобы максимизировать свои шансы угадать правильно? Есть ли другой подход, который позволил бы мне более точно угадывать?P ( 2 ) = 0,5 P ( 3 ) = 0,4P(1)=0.1P(2)=0.5P(3)=0.4


4
Для меня это звучит так, будто вы спрашиваете о независимости: например, если у вас однажды появятся головы, это сделает «хвосты» более вероятными в следующий раз? Если это не то, что вы спрашиваете, не могли бы вы уточнить свой вопрос? (Если я правильно понял ваш вопрос, ответ «да»: в таких ситуациях, как бросание монеты, наиболее вероятным результатом всегда будет результат с наибольшей вероятностью, независимо от того, что произошло ранее.)
arboviral

Спасибо за помощь @arboviral. Да, я предполагаю независимость. Я обновил вопрос, чтобы указать это.
черепаха

4
При условии независимости, лучшее, что вы можете сделать, это выбрать сторону с наибольшей вероятностью. Думайте об этом так. У вас нет другой информации, чтобы сделать более правильное предположение. Все, что вы знаете о кости, это то, как часто появляется определенная сторона и как бросали последние пару. Но независимость говорит вам, что предыдущие строки не влияют на текущий бросок. Может быть, если у вас было больше информации, например, количество силы, использованной для броска костей, метатель левой / правой руки или количество сотрясений перед броском. Однако, если игра в кости действительно честна, я сомневаюсь, что даже такой уровень детализации обеспечит лучшие прогнозы.
Брент Ферье

Ваше предположение верно; это непосредственное следствие неравенства Гольдера (с параметрами ). (1,)
whuber

Вы знаете, что P (H) = 0,2? Или это то, что вы должны выяснить, наблюдая за результатами?
Akavall

Ответы:


43

Ты прав. Если , и вы используете ноль-один убыток (то есть вам нужно угадать фактический результат, а не вероятность или что-то в этом роде, и, кроме того, получить голову, когда вы угадали хвосты, так же плохо, как получая хвосты, когда вы угадали головы), вы должны угадывать хвосты каждый раз.P(H)=0.2

Люди часто ошибочно думают, что ответ состоит в том, чтобы угадать хвосты в случайно выбранных 80% испытаний и головы в оставшейся части. Эта стратегия называется « подбором вероятностей » и широко изучалась при принятии поведенческих решений. Смотрите, например,

Вест Р.Ф., Станович К.Е. (2003). Является ли вероятность совпадения умной? Ассоциации между вероятностным выбором и когнитивными способностями. Память и познание, 31 , 243–251. DOI: 10,3758 / BF03194383


1
+1 за указатель на совпадение вероятностей. Никогда не слышал об этом раньше, хотя я уверен, что ежедневно пользуюсь этим как когнитивным уклоном! :)
leekaiinthesky

2
(+1) Это относится к распространенному заблуждению при интерпретации моделей полиномиальной регрессии и тому подобного: люди могут быть удивлены, что распределение предсказанных классов не соответствует распределению наблюдаемых классов, и даже ищут способы «исправить» его , (Приятно знать, что у него есть имя.)
Scortchi - Восстановить Монику

1
(+1) для термина «сопоставление вероятностей».
Haitao Du

13

По сути, вы задаете очень интересный вопрос: я должен предсказать, используя "MAP Байесовская" Максимальная апостериорная оценка или "Реальный Байесовский"

P(H)=0.22080

argmaxθf(x|θ)

Нетрудно доказать, что таким образом вы можете минимизировать прогнозируемую ошибку (потеря 0-1). Доказательство можно найти на странице 53 « Введение в статистическое обучение» .


Есть еще один способ сделать это, называемый «реальным байесовским» подходом. По сути, вы не пытаетесь «выбрать результат с наибольшей вероятностью, а рассматриваете все случаи с вероятностью». Поэтому, если кто-то попросит вас «предсказать следующие 100» бросков, вам следует приостановить его / ее, потому что, когда вы дали 100 двоичных результатов, вероятностная информация для каждого результата исчезает. Вместо этого вы должны спросить, что вы хотите сделать ПОСЛЕ того, как узнаете результаты.

Предположим, что он / она имеет некоторую функцию потери (необязательно для потери 0-1, например, функция потери может быть такой: если вы пропускаете голову, вам нужно заплатить 1 доллар , но если вы пропустите хвост, вам нужно заплатить 5 долл. , Т. Е. Несбалансированная потеря) в вашем прогнозе, тогда вам следует использовать свои знания о распределении результатов, чтобы минимизировать потери по всему распределению

xyp(x,y)L(f(x),y)

, т. е. включить ваши знания о распределении в убыток, а не «поэтапно», получить прогнозы и сделать следующие шаги.

Более того, у вас очень хорошая интуиция о том, что будет, когда будет много возможных результатов. Оценка MAP не будет работать хорошо, если число результатов велико и масса вероятности широко распространена. Подумайте, у вас есть 100 дополнительных кубиков, и вы знаете истинное распределение. Где и . Теперь, что вы делаете с MAP? Вы всегда будете догадываться, что получите первую сторону , поскольку она имеет наибольшую вероятность по сравнению с другими. Однако вы ошибетесь в случаев!P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%


4
MAP также байесовский. Кроме того, вы описываете как подходы , не обращаясь так или иначе к использованию априорные , что может ввести в заблуждение , так как вы пишете о методах байесовской и настоятели являются основной особенностью этих методов.
Тим

«Итак, если кто-то попросит вас« предсказать следующие 100 »бросков, вы должны отказаться от этого». Если этот кто-то предложит мне миллиард евро, если я сделаю правильный прогноз, я, вероятно, не откажусь. Или, возможно, вы имеете в виду «предсказать» в другом значении, чем «попытаться угадать».
JiK

«когда вы дали 100 бинарных результатов, вероятностная информация для каждого результата исчезла». Сначала я читал это как «когда вам дают 100 бинарных результатов» и не мог понять предложение, но теперь я понял, что это может означать «когда вы даете 100 бинарных результатов ". Какой из них правильный, и если он первый, что это значит?
JiK

1
Очень незначительный момент: я бы, вероятно, добавил вертикальную линию после второго абзаца, чтобы указать, что первые два абзаца технически достаточно для ответа на буквальный вопрос, а остальная часть представляет собой некоторую дополнительную информацию (которая, несомненно, интересна и полезна).
JiK

2
В последнем абзаце: «Оценка MAP не будет работать хорошо, если количество результатов велико. - - Однако вы ошибетесь в 90% случаев !!» Неэффективная работа - это всегда вопрос контекста. Если это, например, игра с повторными ставками (банк делится между людьми, которые правильно угадывают, или возвращается, если никто не угадывает), стратегия MAP обязательно выиграет много денег в долгосрочной перспективе, если вы играете против людей, которые, например, рисуют свои догадки из распределения результатов.
JiK

4

Благодаря независимости ваше значение ожидания всегда будет максимальным, если вы угадываете наиболее вероятный случай. Нет лучшей стратегии, потому что каждый бросок / бросок не дает вам никакой дополнительной информации о монете / кубике.

Везде, где вы предполагаете менее вероятный исход, ваши ожидания выигрыша меньше, чем если бы вы угадали наиболее вероятный случай, поэтому вам лучше угадать наиболее вероятный случай.

Если вы хотите сделать так, чтобы вам нужно было менять свою стратегию, когда вы переворачивали, вы могли бы подумать о монетах / кубиках, в которых вы изначально не знаете шансов, и вам нужно выяснить их во время броска.


1
для меня этот ответ - самое простое объяснение; если вам нужно было определить стратегию, исходя из достигнутого вами ранее результата, это нарушит «независимые» вероятности.
Вальфрат
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.