На самом деле это не всегда «работает» (в смысле всегда улучшается приближение биномиального cdf нормалью при любом Икс ). Если биномиальное значение п равно 0,5, я думаю, что это всегда помогает, за исключением, возможно, самого крайнего хвоста. Если п не слишком далеко от 0,5, то при достаточно большом N оно обычно работает очень хорошо, за исключением дальнего хвоста, но если п близко к 0 или 1, это может вообще не помочь (см. Пункт 6 ниже)
Следует помнить одну вещь (несмотря на то, что рисунки почти всегда содержат pmfs и pdfs), это то, что мы пытаемся приблизиться к cdf. Может быть полезно обдумать, что происходит с cdf бинома и аппроксимирующей нормалью (например, здесь ):n = 20 , p = 0,5
В пределе cdf стандартизированного бинома перейдет к стандартной нормали (обратите внимание, что стандартизация влияет на шкалу по оси x, но не по оси y); на пути к все большему скачки биномиального cdf имеют тенденцию к более равномерному распределению по сравнению с нормальным cdf.N
Давайте увеличим и посмотрим на это в приведенном выше простом примере:
Обратите внимание, что, поскольку аппроксимирующая нормаль проходит близко к середине вертикальных скачков *, тогда как в пределе норма cdf локально приблизительно линейна и (как и прогрессия биномиального cdf вверху каждого скачка); в результате cdf имеет тенденцию пересекать горизонтальные шаги около . Если вы хотите приблизить значение бинома cdf,F(x)в целое числоx, то нормальный cdf достигает этой высоты вблизиx+1х +12F( х )Икс .х +12
* Если мы применим Берри-Эссеена к переменным Бернулли с поправкой на среднее значение, границы Берри-Эссеена дают очень мало места для маневра, когда близко к 1п иxоколоμ- нормальный cdf должен проходить достаточно близко к середине скачков, потому что в противном случае абсолютная разница в cdf превысит лучшую оценку Берри-Эссена с одной или другой стороны. Это в свою очередь относится к тому, как далеко отх+112Иксμ нормальный cdf может пересекать горизонтальную часть шаг-функции биномиального cdf.х +12