Почему исправление непрерывности (скажем, нормальное приближение к биномиальному распределению) работает?

24

Я хотел бы лучше понять, как была получена поправка непрерывности к биномиальному распределению для нормального приближения.

Какой метод использовался, чтобы решить, что мы должны добавить 1/2 (почему не другое число?). Любое объяснение (или ссылка на предлагаемое чтение, кроме этого , будет оценено).

binomial asymptotics

— Таль Галили
источник

29

На самом деле это не всегда «работает» (в смысле всегда улучшается приближение биномиального cdf нормалью при любом $x$ ). Если биномиальное значение $p$ равно 0,5, я думаю, что это всегда помогает, за исключением, возможно, самого крайнего хвоста. Если $p$ не слишком далеко от 0,5, то при достаточно большом $n$ оно обычно работает очень хорошо, за исключением дальнего хвоста, но если $p$ близко к 0 или 1, это может вообще не помочь (см. Пункт 6 ниже)
Следует помнить одну вещь (несмотря на то, что рисунки почти всегда содержат pmfs и pdfs), это то, что мы пытаемся приблизиться к cdf. Может быть полезно обдумать, что происходит с cdf бинома и аппроксимирующей нормалью (например, здесь ): $n=20,p=0.5$

В пределе cdf стандартизированного бинома перейдет к стандартной нормали (обратите внимание, что стандартизация влияет на шкалу по оси x, но не по оси y); на пути к все большему скачки биномиального cdf имеют тенденцию к более равномерному распределению по сравнению с нормальным cdf. $n$

Давайте увеличим и посмотрим на это в приведенном выше простом примере:

Обратите внимание, что, поскольку аппроксимирующая нормаль проходит близко к середине вертикальных скачков *, тогда как в пределе норма cdf локально приблизительно линейна и (как и прогрессия биномиального cdf вверху каждого скачка); в результате cdf имеет тенденцию пересекать горизонтальные шаги около . Если вы хотите приблизить значение бинома cdf,в целое число, то нормальный cdf достигает этой высоты вблизи $x+\frac{_1}{^2}$ $F(x)$ $x$ . $x+\frac{_1}{^2}$

* Если мы применим Берри-Эссеена к переменным Бернулли с поправкой на среднее значение, границы Берри-Эссеена дают очень мало места для маневра, когда близко к $p$ иоколо- нормальный cdf должен проходить достаточно близко к середине скачков, потому что в противном случае абсолютная разница в cdf превысит лучшую оценку Берри-Эссена с одной или другой стороны. Это в свою очередь относится к тому, как далеко от $\frac12$ $x$ $\mu$ нормальный cdf может пересекать горизонтальную часть шаг-функции биномиального cdf. $x+\frac{_1}{^2}$
$P(X=k)$ $n=20, p=0.5, k=9$ $N(10,(\sqrt{5})^2)$

$p(x)$ $x$ $p(x)$

$x-\frac12$ $x+\frac12$ $\frac12$

Можно алгебраически мотивировать этот подход, используя вывод (по аналогии с де Мойвром - см. Здесь или здесь, например), чтобы получить нормальное приближение (хотя это может быть выполнено несколько более непосредственно, чем подход Де Мойвра).

${n \choose x}$ $\log(1+x)\approx x-x^2/2$

$п (Икс знак равно Икс) \approx \frac{1}{\sqrt{2 π N п (1 - п)}} ехр (- \frac{(Икс - N п)^{2}}{2 N п (1 - п)})$ $P(X=x)\approx \frac{1}{\sqrt{2\pi np(1-p)}}\exp(-\frac{(x-np)^2}{2np(1-p)})$
$\mu=np$ $\sigma^2 = np(1-p)$ $x$ $x$

$Y\sim N(np,np(1-p))$ $F(y+\frac12)-F(y-\frac12) = \int_{y-\frac12}^{y+\frac12}f_Y(u)du\approx f_Y(y)$ $f_Y(x)\approx P(X=x)$ $P(X=x)\approx F(x+\frac12)-F(x-\frac12)$

[Подобное приближение типа «правила средней точки» может быть использовано для мотивации других таких приближений непрерывных pmfs плотностями с использованием поправки на непрерывность, но всегда следует быть осторожным, чтобы обратить внимание на то, где имеет смысл вызывать это приближение]
Историческая справка: исправление преемственности, по-видимому, началось с Августа де Моргана в 1838 году как улучшение приближения де Мойвра. См., Например, Hald (2007) [1]. Согласно описанию Халда, его рассуждения были такими же, как в пункте 4 выше (то есть, по сути, с точки зрения попытки приблизить pmf путем замены пика вероятности на «блок» шириной 1 с центром в значении x).
Иллюстрация ситуации, когда исправление непрерывности не помогает:

$X$ $Y$ $F_X(x)\approx F_Y(x+\frac12)$ $p(x) \approx F_Y(x+\frac12)-F_Y(x-\frac12)$ $F_X(x)\approx F_Y(x)$ $p(x) \approx F_Y(x)-F_Y(x-1)$

[1]: Хальд, Андерс (2007),
"История параметрического статистического вывода от Бернулли до Фишера, 1713-1935",
Источники и исследования по истории математики и физических наук,
Springer-Verlag, Нью-Йорк

— Glen_b - Восстановить Монику
источник

1

Я полагаю, что этот фактор обусловлен тем, что мы сравниваем непрерывное распределение с дискретным. Таким образом, нам нужно перевести, что означает каждое дискретное значение в непрерывном распределении. Мы могли бы выбрать другое значение, однако оно не было бы сбалансировано относительно данного целого числа. (т. е. вы бы взвесили вероятность быть на 6 больше к 7, чем к 5.)

Я нашел полезную ссылку здесь: ссылка

— Киттер Каттер
источник