Позвольте мне начать с отрицания предпосылки. Роберт Гири, вероятно, не преувеличивал случай, когда он сказал (в 1947 году) « ... нормальность - это миф; нормального распределения никогда не было и не будет » -
нормальное распределение - это модель *, приближение, которое иногда более или менее полезно.
* (о котором см. Джордж Бокс , хотя я предпочитаю версию в своем профиле).
То, что некоторые явления являются приблизительно нормальными, может не вызывать большого удивления, поскольку суммы независимых [или даже не слишком сильно коррелированных эффектов] следует делать, если их много, и ни одно из них не имеет существенной дисперсии по сравнению с дисперсией Сумма остальных, которые мы могли бы видеть, имеют тенденцию выглядеть более нормальной.
Центральная предельная теорема (которая относится к сходимости к нормальному распределению среднего значения выборки, когда уходит в бесконечность при некоторых мягких условиях), по крайней мере, предполагает, что мы можем увидеть тенденцию к этой нормальности при достаточно больших, но конечных размерах выборки.N
Конечно, если стандартизированные средства приблизительно нормальны, стандартизированные суммы будут; это причина рассуждения о «сумме многих эффектов». Так что, если есть много небольших вкладов в вариацию, и они не сильно коррелированы, вы можете увидеть это.
Теорема Берри-Эссеена дает нам утверждение о ней (сходимость к нормальным распределениям), которая на самом деле происходит со стандартизированными выборочными средствами для данных iid (в несколько более жестких условиях, чем для CLT, поскольку она требует, чтобы третий абсолютный момент был конечным), как а также рассказать нам о том, как быстро это происходит. Последующие версии теоремы имеют дело с неидентично распределенными компонентами в сумме , хотя верхние границы отклонения от нормальности менее жесткие.
Менее формально, поведение сверток с достаточно хорошими распределениями дает нам дополнительные (хотя и тесно связанные) причины подозревать, что во многих случаях это может быть хорошим приближением в конечных выборках. Свертка действует как своего рода «размывающий» оператор, с которым знакомы люди, использующие оценку плотности ядра в разных ядрах; как только вы стандартизируете результат (таким образом, дисперсия остается постоянной каждый раз, когда вы делаете такую операцию), становится очевидным прогресс в направлении все более и более симметричных форм холма, когда вы неоднократно сглаживаете (и не имеет большого значения, если вы меняете ядро каждый раз).
Терри Тао дает хорошее обсуждение версий центральной предельной теоремы и теоремы Берри-Эссеена здесь , а также упоминает подход к независимой версии Берри-Эссеена.
Так что есть по крайней мере один класс ситуаций, в которых мы можем ожидать его увидеть, и формальные причины полагать, что это действительно произойдет в таких ситуациях. Однако в лучшем случае любой смысл, что результат «сумм многих эффектов» будет нормальным, является приближенным. Во многих случаях это вполне разумное приближение (а в дополнительных случаях, даже если приближение распределения не близко, некоторые процедуры, предполагающие нормальность, не особенно чувствительны к распределению отдельных значений, по крайней мере, в больших выборках).
Есть много других обстоятельств, когда эффекты не «добавляются», и мы можем ожидать, что произойдут другие вещи; например, во многих финансовых данных эффекты, как правило, являются мультипликативными (эффекты будут перемещать суммы в процентном выражении, например, проценты и инфляция и обменные курсы). Там мы не ожидаем нормальности, но иногда можем наблюдать грубое приближение к нормальности в логарифмическом масштабе. В других ситуациях ни то, ни другое не подходит, даже в грубом смысле. Например, время между событиями обычно не будет хорошо аппроксимировано ни нормальностью, ни нормальностью бревен; здесь нет ни «сумм», ни «продуктов» эффектов, о которых можно спорить. Существует множество других явлений, которые мы можем привести в качестве аргумента для определенного вида «закона» в определенных обстоятельствах.