Есть ли примеры, когда центральная предельная теорема не выполняется?


32

Википедия говорит -

В теории вероятностей центральная предельная теорема (CLT) устанавливает, что в большинстве ситуаций , когда добавляются независимые случайные величины, их должным образом нормализованная сумма стремится к нормальному распределению (неофициально - «кривая колокола»), даже если сами исходные переменные не являются нормально распределенный ...

Когда говорится «в большинстве ситуаций», в каких ситуациях центральная предельная теорема не работает?

Ответы:


33

Чтобы понять это, вам необходимо сначала указать версию Центральной предельной теоремы. Вот «типичное» утверждение центральной предельной теоремы:

Линдеберг-Леви CLT. Предположим, что является последовательностью случайных величин iid с и . Пусть . Тогда, когда приближается к бесконечности, случайные величины сходятся по распределению к нормальному т.е.X1,X2,E[Xi]=μVar[Xi]=σ2<Sn:=X1++Xnnnn(Snμ)N(0,σ2)

n((1ni=1nXi)μ) d N(0,σ2).

Итак, как это отличается от неформального описания, и каковы пробелы? Есть несколько различий между вашим неофициальным описанием и этим описанием, некоторые из которых были обсуждены в других ответах, но не полностью. Итак, мы можем превратить это в три конкретных вопроса:

  • Что происходит, если переменные не распределены одинаково?
  • Что если переменные имеют бесконечную дисперсию или бесконечное среднее?
  • Насколько важна независимость?

Принимая эти по одному,

Распределение неравномерно . Лучшими общими результатами являются версии центральной предельной теоремы Линдеберга и Ляпонова. В принципе, пока стандартные отклонения не растут слишком сильно, из них можно получить приличную центральную предельную теорему.

Ляпуновский CLT. [5] Предположим, что является последовательностью независимых случайных величин, каждая из которых имеет конечное ожидаемое значение и дисперсию Определите:μ i σ 2 s 2 n =n i = 1 σ 2 iX1,X2,μiσ2sn2=i=1nσi2

Если для некоторого , условие Ляпунова , тогда сумма сходится по распределению к стандартной нормальной случайной переменной, а n стремится к бесконечности:lim n 1δ>0Xi-μi/snlimn1sn2+δi=1nE[|Xiμi|2+δ]=0Xiμi/sn

1sni=1n(Xiμi) d N(0,1).

Теоремы о бесконечной дисперсии, подобные центральной предельной теореме, существуют для переменных с бесконечной дисперсией, но условия значительно более узкие, чем для обычной центральной предельной теоремы. По существу, хвост распределения вероятностей должен быть асимптотическим относительно для . В этом случае соответствующие масштабированные слагаемые сходятся к устойчивому распределению Леви-Альфа . 0 < α < 2|x|α10<α<2

Важность независимости Существует много различных центральных предельных теорем для не независимых последовательностей . Все они очень контекстуальные. Как указывает Бэтмен, есть один для Мартингейла. Этот вопрос является постоянной областью исследований, со многими, многими различными вариациями в зависимости от конкретного контекста интереса. Этот вопрос на Math Exchange является еще одним постом, связанным с этим вопросом.Xi


2
Я удалил блуждающее «>» из формулы, в которую, как мне кажется, вошла из-за системы цитирования - не стесняйтесь отменить мои правки, если они были преднамеренными!
Серебряная рыба

Треугольный массив CLT, вероятно, является более представительным CLT, чем заявленный. Что касается не независимых, мартингейл CLT являются достаточно распространенным случаем.
Бэтмен

@ Бэтмен, каков пример треугольного массива CLT? Не стесняйтесь редактировать мой ответ, чтобы добавить его. Я не знаком с этим.
Джон

Что-то вроде сек. 4.2.3 в personal.psu.edu/drh20/asymp/lectures/p93to100.pdf
Бэтмен

1
«до тех пор, пока стандартные отклонения не растут слишком сильно» или уменьшаются (например:σi2=σi12/2
2/2

21

Хотя я почти уверен, что на него уже отвечали, вот еще один:

Существует несколько версий центральной предельной теоремы, наиболее общая из которых заключается в том, что с учетом произвольных функций плотности вероятности сумма переменных будет распределяться нормально со средним значением, равным сумме средних значений, а также с дисперсией, являющейся суммой отдельных отклонений.

Очень важным и значимым ограничением является то, что среднее значение и дисперсия данных PDF должны существовать и должны быть конечными.

Итак, просто возьмите любой pdf без среднего значения или дисперсии - и центральная предельная теорема больше не будет выполняться. Возьмем, к примеру, лоренцеву распределение.


+1 Или взять распределение с бесконечной дисперсией, например распределение случайного блуждания.
Алексис

2
@Alexis - предполагая, что вы смотрите на случайное блуждание в конечный момент времени, я бы подумал, что оно будет иметь конечную дисперсию, являющуюся суммой из iid шагов, каждый из которых имеет конечную дисперсиюn
Генри

1
@ Генри: Нет, я не предполагаю в определенный момент времени, но дисперсия распределения всех возможных случайных блужданий бесконечной длины.
Алексис

1
@Alexis Если каждый шаг случайного блуждания равен или с одинаковой вероятностью и позиции то из центральной предельной теоремы правильно следует, что при вас есть распределение сходится по распределению к + 1 - 1 Y n = n 1 X i n Xi+11Yn=1nXin N(0,1)n(1nYn)=YnnN(0,1)
Генри

1
@Alexis Не имеет значения для CLT, потому что у каждого отдельного распределения все еще есть конечная дисперсия.
Куб

15

Нет, CLT всегда держится, когда его предположения верны. Такие квалификации, как «в большинстве ситуаций», являются неофициальными ссылками на условия, при которых следует применять CLT.

Например, линейная комбинация независимых переменных из распределения Коши не будет складываться в нормальную распределенную переменную . Одна из причин состоит в том, что дисперсия не определена для распределения Коши , в то время как CLT накладывает на дисперсию определенные условия, например, что она должна быть конечной. Интересным выводом является то, что, поскольку симуляции Монте-Карло мотивированы CLT, вы должны быть осторожны с симуляциями Монте-Карло при работе с распределениями с жирным хвостом, такими как Коши.

Обратите внимание, что существует обобщенная версия CLT. Это работает для бесконечных или неопределенных отклонений, таких как распределение Коши. В отличие от многих хорошо распределенных распределений, правильно нормированная сумма чисел Коши остается Коши. Он не сходится к гауссовскому.

Кстати, не только гауссовские, но и многие другие дистрибутивы имеют PDF в форме колокольчиков, например Student t. Вот почему приведенное вами описание довольно либерально и неточно, возможно, нарочно.


7

Вот иллюстрация ответа херувима, гистограмма 1e5 взята из масштабированных (по ) выборочных средних t-распределений с двумя степенями свободы, так что дисперсия не существует .n

Если CLT действительно применяется, гистограмма для равного должна напоминать плотность стандартного нормального распределения (которое, например, имеет плотность на своем пике), что, очевидно, нет.n = 1000 1 / nn=10001/2π0.4

введите описание изображения здесь

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

3
Здесь вы должны быть немного осторожнее, как если бы вы делали это с распределением, скажем, с степенями свободы, тогда применима теорема о центральном пределе, но ваш график не будет иметь пиковую плотность около а вместо этого около потому что исходная дисперсия не будет3 0,4 1t30.4116π0.231
Генри

Это хороший момент, можно стандартизировать среднее значение, sd(x)чтобы получить что-то, что, если CLT работает, сходится по теореме Слуцкого к N (0,1) вариации. Я хотел сохранить простой пример, но вы, конечно, правы.
Кристоф Ханк

6

Простой случай, когда CLT не может выполняться по очень практическим причинам, - это когда последовательность случайных величин приближается к пределу вероятности строго с одной стороны . Это встречается, например, в оценках, которые оценивают что-то, лежащее на границе.

Возможно, стандартным примером здесь является оценка в образце iid Uniforms . Оценщик максимального правдоподобия будет статистикой максимального порядка, и он будет приближаться к обязательно только снизу: наивно мысля, поскольку предел его вероятности будет , оценщик не может иметь распределение "вокруг" - и CLT ушел.U ( 0 , θ ) θ θ θθU(0,θ)θθθ

Оценщик, должным образом масштабированный, имеет ограничивающее распределение - но не "CLT-разновидность"


3

Вы можете найти быстрое решение здесь.

Возникают исключения из теоремы о центральном пределе

  1. Когда есть несколько максимумов одинаковой высоты, и
  2. Где вторая производная исчезает на максимуме.

Есть некоторые другие исключения, которые изложены в ответе @cherub.


Тот же вопрос уже задавался на math.stackexchange . Вы можете проверить ответы там.


5
Под "максимами" вы подразумеваете моды? Быть бимодальным не имеет ничего общего с неспособностью удовлетворить CLT.
накопление

@ Накопление: формулировка здесь сбивает с толку, потому что это на самом деле относится к PGF дискретного rvM(z)=n=P(X=n)zn
Алекс Р.

@AlexR. Ответ не имеет смысла без прочтения ссылки, и далеко не ясен даже со ссылкой. Я склоняюсь к тому, чтобы понизить голосование, так как это даже хуже, чем ответ только на ссылку.
накопление
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.