Когда центральная предельная теорема и закон больших чисел не согласны


19

По сути, это повторение вопроса, который я нашел на math.se , который не получил ответов, на которые я надеялся.

Пусть {Xi}iN - последовательность независимых одинаково распределенных случайных величин с E[Xi]=1 и .V[Xi]=1

Рассмотрим оценку

limnP(1ni=1nXin)

Этим выражением нужно манипулировать, поскольку обе стороны события неравенства стремятся к бесконечности.

А) ПОПРОБУЙТЕ СУБРАКЦИЮ

Прежде чем рассматривать ограничивающий оператор, вычтите n с обеих сторон:

limnP(1ni=1nXinnn)=limnP(1ni=1n(Xi1)0)=Φ(0)=12

последнее равенство по CLT, где Φ() - стандартная функция нормального распределения.

Б) ПОПРОБУЙТЕ УМНОЖЕНИЕ

Умножьте обе стороны на 1/n

limnP(1n1ni=1nXi1nn)=limnP(1ni=1nXi1)

=limnP(X¯n1)=limnFX¯n(1)=1

где FX¯n() - это функция распределения среднего значения выборки X¯n , которая по LLN сходится по вероятности (а также и по распределению) к константе 1 , отсюда и последнее равенство.

Таким образом, мы получаем противоречивые результаты. Какой правильный? И почему другой не так?


1
@JuhoKokkala Конечно, вот оно, math.stackexchange.com/q/2830304/87400 Просто проигнорируйте ошибку ОП.
Алекос Пападопулос

2
Я думаю, что проблема во втором утверждении, призывающем LLN
Glen_b

3
Я следил за тобой вплоть до окончательного равенства. Это явно неправильно, потому что мы ожидаем, что будет приближаться к для больших и, следовательно, его предел не должен равняться Каково предполагаемое оправдание этого? Это не утверждение какой-либо версии закона больших чисел, которую я знаю. P(X¯n1)1/2n1.
whuber

1
@whuber Предположительно, что все вероятности для выборочного среднего значения концентрируются до значения . Если это не так, я считаю, что важно, чтобы ошибка была подробно изложена в ответе, и это цель этого вопроса. 1
Алекос Пападопулос

2
Алекос, меня беспокоит не то, является ли последний шаг неправильным: это касается твоих причин сделать это. Разве это не все-таки вопрос? Я до сих пор ничего не прочитал от вас, приводя эти причины, и я бы не решался даже догадываться, что они могут быть. Хотя вы ссылаетесь на «LLN», я считаю, что решение вашей проблемы, скорее всего, заключается в том, чтобы точно описать то, что вы понимаете под «LLN».
whuber

Ответы:


15

Ошибка здесь, вероятно, заключается в следующем: сходимость в распределении неявно предполагает, что сходится к в точках непрерывности . Поскольку предельное распределение имеет постоянную случайную величину, оно имеет скачкообразный скачок при , поэтому неверно заключать, что CDF сходится к . F ( x ) F ( x ) x = 1 F ( x ) = 1FN(Икс)F(Икс) F(Икс)Иксзнак равно1F(Икс)знак равно1


1
То, как мы определяем сходимость в распределении, не исключает возможности сходимости в точках разрыва - просто этого не требуется .
Алекос Пападопулос

1
Но если для сходимости в распределении не требуется, чтобы сходилось к F ( 1 ) , на чем основано последнее равенство в вопросе? Fn(1)F(1)
Юхо Коккала

1
@Juho Это не основано ни на чем - это суть вопроса. Не существует теоремы, позволяющей составить последнее уравнение в вопросе.
whuber

1
@AlecosPapadopoulos: я никогда не говорил, что это не исключает возможности. Я неявно говорю, что вам нужно оправдать последнее равенство сверх того, что дается вам от конвергенции в распределении. Например, если является Бернулли, то это было бы верно. ИксN
Алекс Р.

11

Для iid случайных величин с E [ X i ] = var ( X i ) = 1 определяют Z nИксяЕ[Икся]знак равновар(Икся)знак равно1 Теперь, говорит ЦПТчто для любогофиксированноговещественного числаг,ИтпFZп(г)=Φ(г-1). ОП применяет CLT для оценки limnP(Zn1

ZNзнак равно1NΣязнак равно1NИкся,YNзнак равно1NΣязнак равно1NИкся,
ZИтNFZN(Z)знак равноΦ(Z-1)
ИтNп(ZN1N)знак равноΦ(0)знак равно12,

Как указывалось в других ответах, а также в нескольких комментариях к вопросу ОП, подозрительной является оценка ОП . Рассмотрим частный случай, когда iid X i - это дискретные случайные величины, принимающие значения 0 и 2 с равной вероятностью 1ИтNп(YN1)Икся02 . Теперь,Σ п я = 1 Xямогу взять навседаже целых значениях в[0,2п]и поэтомукогдапнечетно, Σ п я = 1 Xяне могу принимать значенияписледовательноYп=112Σязнак равно1NИкся[0,2n]ni=1nXinне могу принять значение1. Кроме того, поскольку распределениеYnсимметрично относительно1, мы имеем то, что P(Yn1)=FYn(1)имеет значение1Yn=1ni=1nXi 1Yn1P(Yn1)=FYn(1) всякий раз, когдаnнечетно. Таким образом,последовательностьчисел P(Y11),P(Y21),,P(Yn1), содержитподпоследовательностьP(Y11),P(Y31),,P(Y12n

P(Y11),P(Y21),,P(Yn1),
в котором все члены имеют значение 1
P(Y11),P(Y31),,P(Y2k11),
. С другой стороны,подпоследовательностьР(Y21),P(Y41),...,P(Y2к1),... являетсясходящейсяк1. Следовательно,limnP(Yn1)не существует и утверждения о сходимостиP(Yn1)12
P(Y21),P(Y41),,P(Y2k1),
1limnP(Yn1) к 1 следует рассматривать с большим подозрением.P(Yn1)

8

Ваш первый результат правильный. Ваша ошибка возникает во второй части, в следующем ошибочном утверждении:

limnFX¯n(1)=1.

Это утверждение неверно (правая часть должна быть ) и это не следует из утвержденногозакона больших чисел. Слабый закон больших чисел (который вы вызываете) говорит о том, что:12

limnP(|X¯n1|ε)=1for all ε>0.

Для всех условие | ˉ X n - 1 | ⩽ & epsi пролеты некоторые значения , где ˉ Х п1 , и некоторые значения , где ˉ Х п > 1 . Следовательно, из LLN не следует, что lim n P ( ˉ X n1 ) = 1 .ε>0|X¯n1|εX¯n1X¯n>1limnP(X¯n1)=1


1
(Действительно ошибочный) результат исходит из импликации «сходимость по вероятности подразумевает сходимость по распределению». Вопрос не утверждает, что утверждение исходит непосредственно из LLN.
Алекос Пападопулос

@AlecosPapadopoulos: сходимость по вероятности делает следует сходимость в распределении. Опять же, сходимость в распределении требуется только в точках непрерывности. Но, может быть, вы имели в виду, что сходимость по вероятности не подразумевает поточечную сходимость распределения.
Алекс Р.

@AlexR. Я не уверен, где лежит ваше возражение. Я считаю, что этот вопрос освещен в моем собственном ответе.
Алекос Пападопулос

3

Сходимость по вероятности подразумевает сходимость по распределению. Но ... какое распределение? Если предельное распределение имеет скачкообразный разрыв, то границы становятся неоднозначными (поскольку на разрыве возможно множество значений).

где является функция распределения выборки среднего ˉ Х п , который по ЗБЧУ сходится по вероятности (а следовательно , и в распределении) до константы 1 ,FX¯n()X¯n1

Это не правильно, и также легко показать, что это не может быть правильно (отличается от разногласий между CLT и LLN). Предельное распределение (которое можно рассматривать как ограничение последовательности нормальных распределенных переменных) должно быть:

FX¯(x)={0for x<10.5for x=11for x>1

ϵ>0x|FX¯n(x)FX¯(x)|<ϵnFX¯(1)=1FX¯(1)=0.5


Предел нормального распределения

Может быть полезно явно выписать сумму, использованную для вызова закона больших чисел.

X¯n=1ni=1nXiN(1,1n)

nX^n

Используя это выражение, легче увидеть, что происходит под капотом, чем использовать готовые законы CLT и LLN, которые затемняют обоснование этих законов.


Сходимость по вероятности

Закон больших чисел дает вам «сходимость по вероятности»

limnP(|X¯n1|>ϵ)=0

ϵ>0

limnP(|1n(Xi1)|>ϵn)=0

limnP(|X¯n1|>0)=0

X¯1,X¯2,X¯3,...X¯nlimnP(X¯n=1)


Шаговая функция Хевисайда и дельта-функция Дирака

X¯n

FX¯n(x)=12(1+erfx12/n)

limnFX¯n(1)=0.5


Я полагаю, что эта точка зрения интуитивно решает ваш вопрос относительно «покажите, что это неправильно» или, по крайней мере, показывает, что вопрос о понимании причины такого несогласия CLT и LLN эквивалентен вопросу о понимании интеграла дельта-функции Дирака. или последовательность нормальных распределений с дисперсией, уменьшающейся до нуля.


2
x=1/2

alimnFX(a+1n)=FX(a)Иксa+1N
limnFX(a+1n)=limnP(Xa+1n)=P(limnXa+1n)=P(Xa)=FX(a)

PPF(x)PF(b)F(a)=P(a<Xb)F
Алекс Р.

2

Я считаю, что к настоящему времени должно быть ясно, что "подход CLT" дает правильный ответ.

Давайте точно определим, где «подход LLN» идет не так.

n1/n

P(1ni=1nXin)=P(1ni=1n(Xi1)0)=P(1ni=1nXi1)

Zn=1ni=1n(Xi1)

P(1ni=1nXin)=FZn(0)=FX¯n(1)

limnFZn(0)=Φ(0)=1/2

X¯nX¯n
X¯n1

F1(x)={1x10x<1F1(1)=1

... so limnFX¯n(1)=F1(1)=1...

...and we just made our mistake. Why? Because, as @AlexR. answer noted, "convergence in distribution" covers only the points of continuity of the limiting distribution function. And 1 is a point of discontinuity for F1. This means that limnFX¯n(1) may be equal to F1(1) but it may be not, without negating the "convergence in distribution to a constant" implication of the LLN.

And since from the CLT approach we know what the value of the limit must be (1/2). I do not know of a way to prove directly that limnFX¯n(1)=1/2.

Did we learn anything new?

I did. The LLN asserts that

limnP(|X¯n1|ε)=1for all ε>0

limn[P(1ε<X¯n1)+P(1<X¯n1+ε)]=1

limn[P(X¯n1)+P(1<X¯n1+ε)]=1

The LLN does not say how is the probability allocated in the (1ε,1+ε) interval. What I learned is that, in this class of convergence results, the probability is at the limit allocated equally on the two sides of the centerpoint of the collapsing interval.

The general statement here is, assume

Xnpθ,h(n)(Xnθ)dD(0,V)

where D is some rv with distribution function FD. Then

limnP[Xnθ]=limnP[h(n)(Xnθ)0]=FD(0)

...which may not be equal to Fθ(0) (the distribution function of the constant rv).

Also, this is a strong example that, when the distribution function of the limiting random variable has discontinuities, then "convergence in distribution to a random variable" may describe a situation where "the limiting distribution" may disagree with the "distribution of the limiting random variable" at the discontinuity points. Strictly speaking, the limiting distribution for the continuity points is that of the constant random variable. For the discontinuity points we may be able to calculate the limiting probability, as "separate" entities.


The 'lesson learned' perspective is interesting, and this is a good, not too difficult, example for didactic application. Although I wonder what kind of (direct) practical application this thinking about the infinite has, because eventually in practice n
Секст Эмпирик

@MartijnWeterings Martijn, мотивация здесь, безусловно, была образовательной, а) как предупреждение о разрывах даже в такой «плоской» ситуации, как сходимость к константе, и так же в целом (например, они разрушают равномерную сходимость), и б) результат о том, как распределяется масса вероятности, становится интересным, когда последовательность, которая сходится по вероятности к константе, все еще имеет ненулевую дисперсию.
Алекос Пападопулос

Мы могли бы сказать, что CLT скажет что-то о сходимости к ограничивающей нормальной распределенной переменной (таким образом, имея возможность выражать такие вещи как F(Икс)), но LLN позволяет нам только сказать, что, увеличивая размер выборки, мы приближаемся к истинному среднему значению, но это не означает, что мы с большей вероятностью получаем «точно равное среднему значению выборки». LLN означает, что среднее значение выборки становится ближе и ближе к предельному значению, но не (с большей вероятностью) равно ему. LLN ничего не говорит оF(Икс)
Секст Эмпирик

Оригинальные мысли о LLN, где на самом деле противоположны (см. Рассуждения Arbuthnot stats.stackexchange.com/questions/343268 ). «Из сказанного видно, что при очень большом количестве игральных костей лот А станет очень маленьким ... будет лишь малая часть всех возможных шансов, поскольку это произойдет в любое назначенное время, что равное количество мужчин и женщин должны родиться ".
Секст Эмпирик
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.