Вы, кажется, предполагаете в своем вопросе, что концепция нормального распределения существовала до того, как распределение было идентифицировано, и люди пытались выяснить, что это было. Мне не ясно, как это будет работать. [Редактировать: есть по крайней мере один смысл, который мы могли бы рассматривать как «поиск дистрибутива», но это не «поиск дистрибутива, который описывает множество явлений»]
Это не вариант; распределение было известно еще до того, как его назвали нормальным распределением.
как бы вы доказали такому человеку, что функция плотности вероятности всех нормально распределенных данных имеет форму колокола
Функция нормального распределения - это то, что имеет то, что обычно называется «формой колокола» - все нормальные распределения имеют одинаковую «форму» (в том смысле, что они отличаются только по масштабу и расположению).
Данные могут выглядеть более или менее «колоколообразно» в распределении, но это не делает его нормальным. Многие ненормальные распределения выглядят аналогично «колоколообразному».
Фактическое распределение населения, из которого извлекаются данные, вероятно, никогда не бывает нормальным, хотя иногда это довольно разумное приближение.
Как правило, это справедливо почти для всех дистрибутивов, которые мы применяем к вещам в реальном мире - это модели , а не факты о мире. [Например, если мы сделаем определенные предположения (те, которые относятся к пуассоновскому процессу), мы можем вывести распределение Пуассона - широко используемое распределение. Но полностью ли удовлетворены эти предположения ? Как правило, лучшее, что мы можем сказать (в правильных ситуациях), это то, что они почти правдивы.]
что мы на самом деле считаем нормально распределенными данными? Данные, которые соответствуют вероятностному закону нормального распределения или что-то еще?
Да, чтобы фактически быть нормально распределенным, популяция, из которой была взята выборка, должна иметь распределение, которое имеет точную функциональную форму нормального распределения. В результате, любое конечное население не может быть нормальным. Переменные, которые обязательно должны быть ограничены, не могут быть нормальными (например, время, затрачиваемое на выполнение определенных задач, длины определенных вещей не могут быть отрицательными, поэтому они не могут быть распределены нормально).
возможно, было бы более интуитивно понятно, что функция вероятности нормально распределенных данных имеет форму равнобедренного треугольника
Я не понимаю, почему это обязательно более интуитивно понятно. Это конечно проще.
При первой разработке моделей для распределения ошибок (особенно для астрономии в раннем периоде) математики рассматривали различные формы в отношении распределений ошибок (включая в одной ранней точке треугольное распределение), но в большей части этой работы это была математика (скорее чем интуиция), который был использован. Например, Лаплас рассмотрел двойное экспоненциальное и нормальное распределения (среди нескольких других). Точно так же Гаусс использовал математику, чтобы вывести ее примерно в одно и то же время, но в связи с другим набором соображений, чем Лаплас.
В узком смысле, что Лаплас и Гаусс рассматривали «распределения ошибок», мы могли бы рассматривать их как «поиск распределения», по крайней мере, какое-то время. Оба постулировали некоторые свойства для распределения ошибок, которые они считали важными (Лаплас рассматривал последовательность несколько разных критериев во времени), что привело к различным распределениям.
В основном мой вопрос: почему функция плотности вероятности нормального распределения имеет форму колокола, а не какую-либо другую?
Функциональная форма вещи, которая называется функцией нормальной плотности, придает ей такую форму. Рассмотрим стандартную нормаль (для простоты; каждая другая нормаль имеет одинаковую форму, отличающуюся только масштабом и расположением):
еZ( з) = k ⋅ e- 12Z2;- ∞ < z< ∞
К
Икс
В то время как некоторые люди считают нормальное распределение как-то «обычным», на самом деле только в определенных ситуациях вы склонны рассматривать его как приблизительное.
Обнаружение распределения обычно приписывается де Моивру (как приближение к биномиальному). Он фактически получил функциональную форму, пытаясь приблизить биномиальные коэффициенты (/ биномиальные вероятности) для аппроксимации утомительных в других отношениях вычислений, но - хотя он эффективно выводит форму нормального распределения - он, похоже, не думал о своем приближении как распределение вероятностей, хотя некоторые авторы предполагают, что он сделал. Требуется определенное количество толкований, поэтому существуют различия в этой интерпретации.
Гаусс и Лаплас работали над этим в начале 1800-х годов; Гаусс писал об этом в 1809 году (в связи с тем, что это распределение, для которого среднее значение является MLE центра), а Лаплас в 1810 году - как приближение к распределению сумм симметричных случайных величин. Десять лет спустя Лаплас дает раннюю форму центральной предельной теоремы для дискретных и непрерывных переменных.
Ранние названия для распределения включают в себя закон ошибки , закон частоты ошибок , и он также был назван в честь Лапласа и Гаусса, иногда совместно.
Термин «нормальный» использовался для независимого описания распределения тремя разными авторами в 1870-х годах (Пирс, Лексис и Гальтон), первым в 1873 году и двумя другими в 1877 году. Это более чем через шестьдесят лет после работы Гаусса и Лапласа и более чем вдвое больше, чем в приближении де Мойр. Использование Гальтона, вероятно, было наиболее влиятельным, но он использовал термин «нормальный» по отношению к нему только один раз в работе 1877 года (в основном называя это «законом отклонения»).
Однако в 1880-х годах Гальтон много раз использовал прилагательное «нормальное» по отношению к распределению (например, как «нормальная кривая» в 1889 году), и он, в свою очередь, оказал большое влияние на более поздних статистиков в Великобритании (особенно на Карла Пирсона). ). Он не сказал, почему он использовал термин «нормальный» таким образом, но, вероятно, имел в виду его в смысле «типичный» или «обычный».
Первое явное использование фразы «нормальное распределение», по-видимому, принадлежит Карлу Пирсону; он, безусловно, использует его в 1894 году, хотя утверждает, что использовал его задолго до этого (претензию я бы рассматривал с некоторой осторожностью).
Ссылки:
Миллер, Джефф
"Самые ранние из известных применений некоторых слов математики:"
Нормальное распределение (статья Джона Олдрича)
http://jeff560.tripod.com/n.html
Шталь, Саул (2006),
"Эволюция нормального распределения",
Математический журнал , Vol. 79, № 2 (апрель), стр. 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Нормальное распределение, (2016, 1 августа).
В Википедии, Свободная энциклопедия.
Получено 12:02, 3 августа 2016 г., из
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
«Нормальное приближение де Моивра к биному, 1733 и его обобщение»,
В: История параметрического статистического вывода от Бернулли до Фишера, 1713–1935; С. 17-24
[Вы можете заметить существенные расхождения между этими источниками по отношению к их описанию де Моивр]