Должен ли я использовать биномиальный cdf или обычный cdf при подбрасывании монет?


11

Монета должна быть проверена на справедливость. 30 голов появляются после 50 сальто. Если предположить, что монета справедлива, какова вероятность того, что вы получите как минимум 30 голов за 50 бросков?

Правильный способ решить эту проблему, по словам моего учителя, это сделать

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

Тем не менее, я взял биномиальную функцию распределения, как это

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

Я полагаю, что критерии для биномиального распределения удовлетворены: отдельные события независимы, есть только два возможных результата (голова против хвостов), вероятность постоянна для вопроса (0.5), и число испытаний установлено на 50 Тем не менее, очевидно, что два метода дают разные ответы, и симуляция поддерживает мой ответ (по крайней мере, несколько раз, когда я его запускал; очевидно, я не могу гарантировать, что вы получите те же результаты).

Является ли мой учитель ошибочным, полагая, что кривая нормального распределения также будет правильным способом решения этой проблемы (ни в коем случае не говорится, что распределение нормальное, но n * p и n * (1-p) больше, чем 10), или я что-то не так понял о биномиальных распределениях?


5
Человек с опытом использования нормальных приближений к биному будет действовать немного иначе: он будет применять (обычную) коррекцию непрерывности , как в 1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(это R-выражение), значение которого равно 0,1015, в довольно близком согласии с биномиальным cdf ,
whuber

Ответы:


10

Вот иллюстрация ответов whuber и onetop.

исправление непрерывности

В красном биномиальное распределение , в черном - плотность нормального приближения , а в синем - поверхность, соответствующая для .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

Высота красной полосы, соответствующей для , хорошо аппроксимируется . Чтобы получить хорошее приближение , вам нужно использовать .P(X=k)XBin(50,0.5)P(X30)P(Y>29,5)P(k12<Y<k+12)P(X30)P(Y>29.5)

(править) Это (получено в R с помощью ), тогда как приближение правильное.Р ( Х 30 ) 0,1013194 :

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

Это называется исправлением непрерывности . Это позволяет вам вычислять даже «точечные вероятности», такие как : P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.

4

Нормальное распределение дает более близкое приближение к биному, если вы используете коррекцию непрерывности . Используя это для вашего примера, я получаю 0,1015. Поскольку это домашнее задание, я оставлю это вам, чтобы заполнить детали.


4

Учти это. В дискретном биномиальном распределении у вас есть фактические вероятности для отдельных чисел. В непрерывной норме это не так, вам нужен диапазон значений. Итак ... если бы вы собирались приблизить вероятность отдельного значения, скажем, X, из бинома с нормальным, как бы вы это сделали? Посмотрите на гистограмму вероятности биномиального распределения с нормальной кривой, наложенной на него. Вам действительно нужно выбрать из X ± 0,5, чтобы получить что-то похожее на биномиальную вероятность X в нормальном приближении.

Теперь распространите это на то, когда вы выбираете хвост дистрибутива. Когда вы используете биномиальный метод, вы выбираете вероятность всего значения (в вашем случае 30) плюс все, что выше. Поэтому, когда вы делаете непрерывное, вы должны убедиться, что вы захватили это и также выбрали на 0,5 меньше, поэтому отсечение для непрерывного распределения составляет 29,5.


3
На самом деле, вопрос демонстрирует вдумчивое понимание проблемы и, похоже, не ищет ответа на обычный домашний вопрос. Хотя это помеченное домашнее задание , рассмотрите возможность сделать здесь исключение. В частности, хорошее обсуждение использования нормального распределения для аппроксимации дискретных распределений (таких как биномы и пуассоны с большими N) было бы уместным и приветствовалось бы здесь.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.