Вот гораздо более простой способ понять это:
Вы можете смотреть на биномиальное распределение как на «мать» большинства дистрибутивов. Нормальное распределение является лишь приближением биномиального распределения, когда n становится достаточно большим. Фактически, Авраам де Моивр, по сути, обнаружил нормальное распределение, пытаясь приблизиться к биномиальному распределению, потому что оно быстро выходит из-под контроля для вычисления биномиального распределения по мере роста n, особенно когда у вас нет компьютеров ( ссылка ).
Распределение Пуассона также является еще одним приближением биномиального распределения, но оно гораздо лучше, чем нормальное распределение, когда n велико, а p мало, или, точнее, когда среднее приблизительно равно дисперсии (помните, что для биномиального распределения среднее = np и var = нп (1-р)) ( ссылка ). Почему эта конкретная ситуация так важна? По-видимому, в реальной жизни это проявляется очень часто, и поэтому у нас есть это «особое» приближение. Ниже приведен пример сценариев, в которых приближение Пуассона работает очень хорошо.
пример
У нас есть датацентр на 100 000 компьютеров. Вероятность того, что какой-либо компьютер выйдет из строя сегодня, составляет 0,001. Таким образом, в среднем np = 100 компьютеров выходят из строя в центре обработки данных. Какова вероятность того, что сегодня выйдет из строя только 50 компьютеров?
Binomial: 1.208E-8
Poisson: 1.223E-8
Normal: 1.469E-7
На самом деле, качество аппроксимации для нормального распределения идет на спад, так как мы идем в хвосте распределения, но Пуассон продолжает держаться очень хорошо. В приведенном выше примере давайте рассмотрим, какова вероятность того, что только 5 компьютеров выйдут из строя сегодня?
Binomial: 2.96E-36
Poisson: 3.1E-36
Normal: 9.6E-22
Надеемся, что это даст вам лучшее интуитивное понимание этих 3-х дистрибутивов.