Какое интуитивное объяснение существует для центральной предельной теоремы?


144

В нескольких различных контекстах мы используем центральную предельную теорему для обоснования любого статистического метода, который мы хотим принять (например, аппроксимируем биномиальное распределение нормальным распределением). Я понимаю технические детали относительно того, почему теорема верна, но мне только что пришло в голову, что я не совсем понимаю интуицию, лежащую в основе центральной предельной теоремы.

Итак, какова интуиция за центральной предельной теоремой?

Объяснения дилетанта были бы идеальными. Если требуются какие-то технические детали, пожалуйста, предположите, что я понимаю концепции pdf, cdf, случайных величин и т. Д., Но не знаю концепций сходимости, характеристических функций или чего-либо общего с теорией меры.


8
Хороший вопрос, хотя моя немедленная реакция, подкрепленная моим ограниченным опытом преподавания этого, заключается в том, что CLT изначально совсем не интуитивен для большинства людей. Во всяком случае, это нелогично!
2010 года

2
@onetop AMEN! взгляд на биномиальное распределение с p = 1/2 при увеличении n показывает, что CLT скрывается - но интуиция для него всегда ускользала от меня.
Ронаф

2
Подобный вопрос с некоторыми хорошими идеями: stats.stackexchange.com/questions/643/…

1
Не объяснение, но это моделирование может помочь понять это.
Дэвид Лейн

Ответы:


119

Я заранее прошу прощения за длину этого поста: с некоторым трепетом я вообще обнародовал его, потому что на его прочтение уходит некоторое время и внимание, и, несомненно, есть типографские ошибки и пояснительные ошибки. Но здесь для тех, кто интересуется увлекательной темой, предлагается в надежде, что она побудит вас определить одну или несколько из множества частей CLT для дальнейшей проработки собственных ответов.


Большинство попыток «объяснить» CLT являются иллюстрациями или просто заявлениями, которые утверждают, что это правда. Действительно проницательное, правильное объяснение должно было бы объяснить очень много вещей.

Прежде чем смотреть на это дальше, давайте проясним, что говорит CLT. Как вы все знаете, существуют версии, которые различаются по своей общности. Общий контекст - это последовательность случайных величин, которые представляют собой определенные виды функций в общем вероятностном пространстве. Для интуитивных объяснений, которые держатся строго, я считаю полезным думать о пространстве вероятностей как о коробке с различимыми объектами. Неважно, что это за объекты, но я назову их «билетами». Мы делаем одно «наблюдение» за коробкой, тщательно перепутывая билеты и вынимая их; этот билет составляет наблюдение. После записи для последующего анализа мы возвращаем билет в коробку, чтобы его содержимое не изменилось. «Случайная величина» - это число, написанное на каждом билете.

В 1733 году Авраам де Моивр рассмотрел случай с одной коробкой, в которой числа на билетах являются только нулями и единицами («Испытания Бернулли»), причем присутствуют некоторые из каждого числа. Он вообразил, что делает физически независимых наблюдений, получая последовательность значений , все из которых равны нулю или единице. Сумма этих значений, , является случайным , так как члены в сумме есть. Поэтому, если бы мы могли повторить эту процедуру много раз, различные суммы (целые числа в диапазоне от до ) появились бы с различными частотами - пропорциями от общего количества. (См. Гистограммы ниже.)x 1 , x 2 , , x n y n = x 1 + x 2 + + x n 0 nnx1,x2,,xnyn=x1+x2++xn0n

Теперь можно было бы ожидать - и это правда - что при очень больших значениях все частоты будут довольно малы. Если бы мы были настолько смелыми (или глупыми), чтобы попытаться «взять предел» или «позволить перейти к », мы бы правильно сделали вывод, что все частоты уменьшаются до . Но если мы просто рисуем гистограмму частот, не обращая никакого внимания на то, как помечены ее оси, мы видим, что все гистограммы для больших начинают выглядеть одинаково: в некотором смысле эти гистограммы приближаются к пределу, даже если частоты сами все сводятся к нулю.n 0 nnn0n

Гистограммы

Эти гистограммы отображают результаты повторения процедуры получения много раз. - это «количество испытаний» в заголовках. пynn

Проницательность здесь состоит в том, чтобы сначала нарисовать гистограмму, а затем обозначить ее оси . С большимn гистограмма охватывает большой диапазон значений, сосредоточенных вокруг (по горизонтальной оси) и исчезающе малый интервал значений (по вертикальной оси), поскольку отдельные частоты растут довольно маленькими. Для встраивания этой кривой в область построения графика потребовалось смещение и изменение масштаба гистограммы. Математическое описание этого состоит в том, что для каждого n мы можем выбрать некоторое центральное значение m n (не обязательно уникальное!) Для позиционирования гистограммы и некоторого значения шкалы s nn/2nmnsn(не обязательно уникальный!), чтобы он соответствовал осям. Это можно сделать математически, изменив на z n = ( y n - m n ) / s n .ynzn=(ynmn)/sn

Помните, что гистограмма представляет частоты по областям между ней и горизонтальной осью. Следовательно, возможная стабильность этих гистограмм для больших значений должна быть указана в терминах площади. n Итак, выберите любой интервал значений, который вам нравится, скажем, от до b > a и, по мере увеличения n , отследите область части гистограммы z n, которая горизонтально охватывает интервал ( a , b ] . CLT утверждает несколько вещи:ab>anzn(a,b]

  1. Независимо от того, что такое и b ,ab если мы выберем последовательности и s n соответствующим образом (таким образом, что вообще не зависит от a или b ), эта область действительно приближается к пределу, так как n становится большим.mnsnabn

  2. Последовательности и s n могут быть выбраны таким образом, который зависит только от n , среднего значения в поле и некоторой меры разброса этих значений, но не от чего-либо другого, так что независимо от того, что находится в поле, предел всегда одинаков. (Это свойство универсальности удивительно.)mnsnn

  3. В частности, что ограничение область представляет собой площадь под кривой междуaиb: это формула этой универсальной предельной гистограммы.y=exp(z2/2)/2πab

    Первое обобщение CLT добавляет,

  4. Когда в рамке могут содержаться числа в дополнение к нулям и единицам, имеют место точно такие же выводы (при условии, что пропорции чрезвычайно больших или малых чисел в ячейке не являются «слишком большими», критерий, который имеет точное и простое количественное выражение) ,

    Следующее, и, возможно, самое удивительное обобщение заменяет эту единственную коробку билетов заказанным бесконечно длинным набором коробок с билетами. Каждая коробка может иметь разные номера на своих билетах в разных пропорциях. Наблюдение выполняется путем извлечения билета из первого окна, x 2 - из второго окна и так далее.x1x2

  5. Точно такие же выводы имеют место при условии, что содержимое полей «не слишком отличается» (есть несколько точных, но разных количественных характеристик того, что должно означать «не слишком другое»; они допускают удивительную величину широты).

Эти пять утверждений, как минимум, нуждаются в объяснении. Есть еще кое-что. Несколько интригующих аспектов установки подразумеваются во всех утверждениях. Например,

  • Что особенного в сумме ? Почему у нас нет центральных предельных теорем для других математических комбинаций чисел, таких как их произведение или их максимум? (Оказывается, мы это делаем, но они не настолько общие и не всегда имеют такой простой и понятный вывод, если их нельзя свести к CLT.) Последовательности и s n не уникальны, но они почти уникальны в том смысле, что в конечном итоге они должны аппроксимировать ожидание суммы n билетов и стандартное отклонение суммы соответственно (что в первых двух утверждениях CLT равно mnsnn раз стандартное отклонение коробки). n

    Стандартное отклонение является одной мерой разброса ценностей, но оно ни в коем случае не единственное и не самое «естественное», как в историческом, так и во многих случаях. (Многие люди выбирают что-то вроде медианного абсолютного отклонения от медианы , например.)

  • Почему SD появляется таким существенным образом?

  • Рассмотрим формулу для предельной гистограммы: кто бы мог ожидать, что она примет такую ​​форму? В нем говорится, что логарифм плотности вероятности является квадратичной функцией. Почему? Есть ли какое-то интуитивное или ясное, убедительное объяснение этому?


Признаюсь, я не могу достичь конечной цели предоставления ответов, которые достаточно просты, чтобы соответствовать сложным критериям Srikant в отношении интуитивности и простоты, но я набросал этот фон в надежде, что другие будут вдохновлены, чтобы заполнить некоторые из многочисленных пробелов. Я думаю, что хорошая демонстрация в конечном итоге должна опираться на элементарный анализ того, как значения между и β n = b s n + m n могут возникать при формировании суммы x 1 + x 2 + + х нαn=asn+mnβn=bsn+mnx1+x2++xn, Возвращаясь к версии CLT для одного бокса, случай симметричного распределения проще в обращении: его медиана равна среднему значению, так что есть вероятность 50%, что будет меньше среднего значения коробки, и шанс 50%. что х я будет больше, чем его среднее значение. Более того, когда n достаточно велико, положительные отклонения от среднего значения должны компенсировать отрицательные отклонения в среднем. (Это требует некоторого тщательного обоснования, а не только размахивания руками.) Таким образом, мы должны в первую очередь заботиться о подсчете количества положительных и отрицательных отклонений и иметь лишь второстепенную заботу об их размерах.xixin (Из всего, что я написал здесь, это может быть наиболее полезным для предоставления некоторой интуиции о том, почему CLT работает. Действительно, технические предположения, необходимые для того, чтобы сделать обобщения CLT истинными по существу, являются различными способами исключить возможность того, что редкие огромные отклонения нарушат баланс настолько, чтобы предотвратить возникновение предельной гистограммы.)

В любом случае это показывает, в какой-то степени, почему первое обобщение CLT на самом деле не раскрывает ничего, чего не было в первоначальной пробной версии Бернулли де Мойвра.

На данный момент кажется, что для этого нет ничего, кроме небольшой математики: нам нужно посчитать количество различных способов, которыми число положительных отклонений от среднего может отличаться от количества отрицательных отклонений на любое заранее определенное значение где, очевидно, k является одним из - n , - n + 2 , , n - 2 , n . Но так как исчезающие мелкие ошибки исчезнут в пределе, нам не нужно считать точно; нам нужно только приблизительное количество. Для этого достаточно знать, чтоkkn,n+2,,n2,n

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(Это совершенно элементарный результат, поэтому я не стану записывать обоснование.) Теперь мы приближаемся к оптовой цене. Максимальная частота возникает, когда максимально близко к n / 2, насколько это возможно (также элементарно). Давайте напишем m = n / 2 . Затем, относительно максимальной частоты, частота m + j + 1 положительных отклонений ( j 0 ) оценивается произведениемkn/2m=n/2m+j+1j0

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

За 135 лет до того, как де Моивр писал, Джон Нейпир изобрел логарифмы, чтобы упростить умножение, поэтому давайте воспользуемся этим. Используя приближение

log(1x1+x)2x,

мы находим, что журнал относительной частоты составляет примерно

2/(m+1)4/(m+1)2j/(m+1)=j(j+1)m+1j2m.

Поскольку накопленная ошибка пропорциональна , это должно работать хорошо, если j 4 мало по отношению к м 3 . Это охватывает больший диапазон значений j, чем необходимо. (Достаточно, чтобы приближение работало для j только порядка j4/m3j4m3jj , асимптотически намного меньшечемм 3 / 4 )mm3/4


Очевидно, что гораздо больший анализ такого рода должен быть представлен для обоснования других утверждений в CLT, но у меня заканчиваются время, пространство и энергия, и я, вероятно, потерял 90% людей, которые все равно начали читать это. Это простое приближение, тем не менее, наводит на мысль, что де Муавр изначально мог предположить, что существует универсальное предельное распределение, что его логарифм является квадратичной функцией, и что надлежащий масштабный коэффициент должен быть пропорционален sn (потому чтоj2/m=2j2/n=2(j/n). j2/m=2j2/n=2(j/n)2 Трудно представить, как можно объяснить эти важные количественные отношения, не прибегая к какой-либо математической информации и рассуждениям; что-то меньшее оставит точную форму ограничивающей кривой полной загадкой.


5
+1 Мне понадобится некоторое время, чтобы переварить твой ответ. Я признаю, что запросить интуицию для CLT в рамках ограничений, которые я наложил, может быть почти невозможно.

2
Спасибо, что нашли время написать это, это самая полезная экспозиция CLT, которую я когда-либо видел, которая также очень доступна математически.
Джереми Рэдклифф

1
Да, довольно плотно .... так много вопросов. Как у первой гистограммы было 2 бара (было только 1 испытание!); Могу ли я просто игнорировать это? И соглашение обычно состоит в том, чтобы избежать горизонтальных промежутков между столбцами гистограммы, правильно? (потому что, как вы говорите, площадь важна, и площадь в конечном итоге будет рассчитываться по непрерывной (то есть без пропусков) области)? Так что я тоже буду игнорировать пробелы ...? Даже у меня были пробелы, когда я впервые попытался понять это :)
Красный горох

1
@TheRed Спасибо за ваши вопросы. Я отредактировал первую часть этого поста, чтобы немного прояснить эти моменты.
whuber

4
Ах, да, я перепутал «количество испытаний = =« наблюдения »» с «количеством повторений (вся эта процедура)». Поэтому, если билет может иметь значение только двух значений, 0 или 1 , и вы наблюдаете только один билет, сумма значений этих билетов может быть только одной из двух : 0 или 1 . Следовательно, ваша первая гистограмма имеет два столбца. Более того, эти столбики примерно равны по высоте, потому что мы ожидаем, что 0 и 1 будут встречаться в равных пропорциях. n
Красный горох

27

Самая хорошая анимация, которую я знаю: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

8 горизонтальных слоев одинаково расположенных штифтов, каждый из которых находится в шахматном порядке, создают препятствие в стиле «пачинко / пинбол» для шаров, пропущенных через эти штифты.  Каждый шар падает внизу, и когда шары складываются, их высота приближается к контуру кривой Гаусса.  Это показывает, что сумма многих независимых случайных событий (слоев) приведет к гауссовому распределению результатов (высота сложенного шара)

Простейшие слова, которые я прочитал: http://elonen.iki.fi/articles/centrallimit/index.en.html

Если вы суммируете результаты этих десяти бросков, то, что вы получите, вероятно, будет ближе к 30-40, чем максимум, 60 (все шестерки) или, с другой стороны, минимум, 10 (все).

Причина этого заключается в том, что вы можете получить средние значения гораздо более разными способами, чем крайние. Пример: при броске двух кубиков: 1 + 6 = 2 + 5 = 3 + 4 = 7, но только 1 + 1 = 2 и только 6 + 6 = 12.

То есть: даже если вы выберете любое из шести чисел с одинаковой вероятностью, бросая один кубик, крайности менее вероятны, чем средние значения в суммах нескольких кубиков.


20

Интуиция - сложная вещь. Это даже сложнее с теорией в наших руках, связанных за нашей спиной.

CLT все о суммах крошечных, независимых беспорядков. «Суммы» в смысле выборки означают «крошечные» в смысле конечной дисперсии (совокупности) и «возмущения» в смысле плюс / минус вокруг центрального значения (совокупности).

Для меня устройство, которое больше всего привлекает интуицию, - это quincunx, или «ящик Галтона», см. Википедию (для «бобовой машины»?) Идея состоит в том, чтобы катить крошечный шарик по поверхности доски, украшенной решеткой. из одинаково расположенных штифтов. На пути вниз мяч отклоняется вправо и влево (... случайно, независимо) и накапливается внизу. Со временем мы видим красивую форму насыпи в форме колокола прямо перед нашими глазами.

CLT говорит то же самое. Это математическое описание этого явления (точнее, квинкункс является физическим доказательством нормального приближения к биномиальному распределению). Грубо говоря, CLT говорит, что, пока наша популяция не ведет себя чрезмерно неправильно (то есть, если хвосты PDF достаточно тонки), то среднее значение выборки (правильно масштабированное) ведет себя так же, как тот маленький шарик, отскакивающий от лица Quincunx: иногда он падает слева, иногда он падает вправо, но большую часть времени он приземляется прямо посередине, в форме красивого колокольчика.

Величие CLT (для меня) заключается в том, что форма основной популяции не имеет значения. Форма играет роль только постольку, поскольку она делегирует период времени, который нам нужно ждать (в смысле размера выборки).


17

Замечание относительно CLT может быть следующим. Когда у вас есть сумма множества случайных компонентов, если один «меньше, чем обычно», то это в основном компенсируется некоторыми другими компонентами, которые «больше, чем обычно» , Другими словами, отрицательные отклонения и положительные отклонения от компонента означают взаимное исключение в суммировании. Лично у меня нет четкой интуиции, почему именно оставшиеся отклонения образуют распределение, которое выглядит тем более нормальным, чем больше у вас терминов.

S=X1+X2++Xn

Существует много версий CLT, некоторые более сильные, чем другие, некоторые с ослабленными условиями, такими как умеренная зависимость между членами и / или неидентичные распределения для условий. В простейшем случае к доказать версии ЦПТА, доказательство, как правило , на основе функции момента генерирующей (или преобразование Лапласа-Стилтьеса или какой - либо другое подходящее преобразование плотности) суммы . Запись этого в виде разложения Тейлора и сохранение только самого доминирующего термина дает вам генерирующую момент функцию нормального распределения. Так что лично для меня нормальность - это то, что вытекает из ряда уравнений, и я не могу представить какую-либо дополнительную интуицию, кроме этой.S

Однако следует отметить, что распределение суммы, как правило , никогда не распределяется нормально, и при этом CLT не утверждает, что это будет. Если n конечно, все еще есть некоторое расстояние до нормального распределения, и если n = ∞, то и среднее значение, и дисперсия также бесконечны. В последнем случае вы можете взять среднее бесконечной суммы, но тогда вы получите детерминированное число без какой-либо дисперсии, которое вряд ли можно было бы пометить как «нормально распределенное».nn=

Это может создать проблемы с практическим применением CLT. Обычно, если вас интересует распределение вблизи его центра, CLT работает нормально. Однако сходимость к нормали не везде одинакова, и чем дальше вы удаляетесь от центра, тем больше слагаемых вам нужно иметь разумное приближение.S/n

При всей «святости» центральной предельной теоремы в статистике, ее ограничения часто упускаются слишком легко. Ниже я привожу два слайда из моего курса, подчеркивая, что CLT полностью терпит неудачу в любом практическом случае использования. К сожалению, многие люди специально используют CLT для оценки вероятностей хвоста, сознательно или нет.

введите описание изображения здесь введите описание изображения здесь


5
Это отличный материал и мудрый совет. К сожалению, я не могу отрицать это, потому что утверждения в «Эта нормальность - математический артефакт, и я думаю, что бесполезно искать какую-либо более глубокую истину или интуицию за ней», вызывают глубокую тревогу. Кажется, они предполагают, что (1) мы не должны полагаться на математику, чтобы помочь нам теоретически, и (2) нет смысла понимать математику в первую очередь. Я надеюсь, что другие посты в этой теме уже во многом опровергают второе утверждение. Первый настолько самосогласован, что вряд ли требует дальнейшего анализа.
whuber

2
@whuber. Вы правы, я вне моей лиги, возможно. Я отредактирую
StijnDeVuyst

3
Спасибо за пересмотр проблемной части, и большой +1 для остальных.
whuber

7

Этот ответ надеется дать интуитивное значение центральной предельной теоремы, используя простые методы исчисления (разложение Тейлора порядка 3). Вот схема:

  1. Что говорит CLT
  2. Интуитивное доказательство CLT с использованием простого исчисления
  3. Почему нормальное распределение?

Мы упомянем нормальное распределение в самом конце; потому что факт, что нормальное распределение в конечном счете подходит, не несет особой интуиции.

1. Что говорит центральная предельная теорема? Несколько версий CLT

xX1,,Xn Чтобы понять, что являетсяуниверсальнымиинтуитивно понятнымв CLT, давайте на минутку забудем о пределе. Вышеприведенное утверждение говорит, что если

P(X1++Xnnx)n+xet2/22πdt.
X1.,,XnZ1,,Zn
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
fx
f(t)={1 if t<x0 if tx.
X1,,XnZ1,,Znпри условии, что случайные величины не зависят от среднего нуля, дисперсия одна.

kX1,,XnZ1,,Znf

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

Можно установить эквивалентность («тогда и только тогда») между следующими утверждениями:

  1. ff(t)=1t<xf(t)=0txx
  2. f:RR
  3. C
  4. fsupxR|f(x)|1

Каждый из 4 пунктов выше говорит о том, что сходимость имеет место для большого класса функций. С помощью аргумента технической аппроксимации можно показать, что четыре приведенных выше пункта эквивалентны. Мы отсылаем читателя к главе 7, стр. 77 книги Дэвида Полларда. Руководство пользователя по измерению теоретических вероятностей, из которых этот ответ весьма вдохновлен.

Наше предположение об оставшейся части этого ответа ...

supxR|f(x)|CC>0E[|Xi|3]E[|Zi|3]

E[f(X1++Xnn)]X1,...,Xn

X1,,XnZ1,,Zn

XiZiW=Z1++Zn1h(x)=f(x/n)

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
MnMnXnWE[Xnh(W)]=E[Xn]E[h(W)]=0

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3h(t)=f(t/n)/(n)3XnZn

Xn1Zn1W~=Z1+Z2++Zn2+Xn

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
Zn1W~Xn1W~

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
nX1,,XnZ1,,ZnXiZiO(1/(n)3)XiZiO(1/n)

E[f(X1++Xnn)]X1,,XnE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1

3. Почему нормальное распределение?

E[f(X1++Xnn)]XiO(1/n)

E[f(X1++Xnn)]

X1,,Xn(X1++Xn)/n

N(0,1)Z1,,ZnN(0,1)Z1++ZnnN(0,1)nZN(0,1)

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

Вы, кажется, утверждаете закон больших чисел, а не CLT.
uber

1
E[f((X1+...+Xn)/n)]E[f(Z)]ZN(0,1)f

2
Я понимаю, что вы имеете ввиду. Что заставляет меня задуматься, так это то, что ваше утверждение касается только ожиданий, а не распределений, тогда как CLT делает выводы об ограничивающем распределении. Эквивалентность между этими двумя понятиями может быть не сразу очевидна для многих. Могу ли я тогда предложить, чтобы вы предоставили явную связь между вашим утверждением и обычными утверждениями CLT с точки зрения ограничения распределения? (+1 кстати: спасибо за разработку этого аргумента.)
whuber

1

Я разочаровался в попытке придумать интуитивно понятную версию и придумал некоторые симуляции. У меня есть один, который представляет симуляцию Quincunx, и некоторые другие, которые делают такие вещи, как показывают, как даже искаженное сырое распределение времени реакции станет нормальным, если вы соберете достаточно RT на предмет. Я думаю, что они помогают, но они новички в моем классе в этом году, и я еще не сдал первый тест.

Одной вещью, которую я считал хорошей, была способность показать закон больших чисел. Я мог бы показать, как переменные вещи с небольшими размерами выборки, а затем показать, как они стабилизируются с большими. Я также делаю кучу других демонстраций большого количества. Я могу показать взаимодействие в Quincunx между числами случайных процессов и числами образцов.

(оказывается, что не использовать мел или белую доску в моем классе, возможно, было благословением)


Привет, Джон: рад видеть тебя с этим постом почти через девять лет! Было бы интересно прочитать об опыте, который вы получили за время использования симуляций для обучения идее CLT и LLN.
whuber

Я прекратил преподавать этот класс год спустя, но последующий преподаватель подхватил идею симуляции. На самом деле он продвигает его гораздо дальше и разработал ряд блестящих приложений и предлагает ученикам поиграть в симуляции для множества вещей в классе из 250 человек. Насколько я могу судить по преподаванию в старших классах, ученики, похоже, многого от этого получают. Разница между его учениками и учениками из эквивалентных фидерных классов заметна. (но, конечно, там много неконтролируемых переменных)
Джон

Спасибо, Джон. Это настолько необычно, чтобы получить даже анекдотическую обратную связь о длительной успеваемости ученика после окончания урока, что я нахожу даже эту ограниченную информацию интересной.
whuber

-8

Когда вы добавляете много гистограмм случайных распределений вместе, вы либо поддерживаете нормальную форму распределения, потому что все отдельные гистограммы уже имеют эту форму, либо вы получаете эту форму, потому что флуктуации в отдельных гистограммах имеют тенденцию компенсировать друг друга, если вы добавляете большие количество гистограмм. Гистограмма случайного распределения одной переменной уже приблизительно распределена таким образом, что люди начали называть нормальным распределением, потому что это так часто встречается, и это микрокосм центральной предельной теоремы.

Это не вся история, но я думаю, что она настолько интуитивна, насколько это возможно.


2
2

5
18,14,12,14,18 ; на самом деле это даже не функция вероятности! Также не количество голов подряд имеет ничего общего с вопросом.
Дилип Сарватэ
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.