Не ясно, насколько интуитивно понятен читатель этого вопроса о сходимости чего-либо, не говоря уже о случайных переменных, поэтому я напишу, как будто ответ «очень мало». То , что могло бы помочь: а не думать « как может случайная величина сходится», спросите , как последовательность случайных величин может сходиться. Другими словами, это не просто одна переменная, а (бесконечно длинный!) Список переменных, и те, которые позже в списке, становятся все ближе и ближе к ... чему-то. Возможно, один номер, возможно, целый дистрибутив. Чтобы развить интуицию, нам нужно понять, что означает «все ближе и ближе». Причина, по которой существует так много способов сходимости для случайных величин, заключается в том, что существует несколько типов
Сначала давайте подведем итоги сходимости последовательностей действительных чисел. В мы можем использовать евклидово расстояние | х - у | измерить, насколько близко х к у . Рассмотрим x n = n + 1р | х-у|ИксY . Тогда последовательностьх1,ИксN= n + 1N= 1 + 1N начинается 2 , 3Икс1,Икс2,Икс3, ...и я утверждаю, чтоxnсходится к1. Ясно, чтоxnстановитсяближек1, но также верно, чтоxnприближается к0.9. Например, начиная с третьего слагаемого, члены в последовательности находятся на расстоянии0,5или менее от0,9. Важно точто они получаютпроизвольноблизко к1, но не0,9. Никакие термины в последовательности никогда не встречаются в пределах0,05от0,92 , 32,43,54,65,…xn1xn1xn0.90.50.910.90.050.9не говоря уже о том, чтобы оставаться так близко для последующих сроков. В отличие от равно 0,05 от 1 , и все последующие члены находятся в пределах 0,05 от 1 , как показано ниже.x20=1.050.0510.051
Я мог бы быть более строгим и требовать, чтобы условия находились и оставались в пределах от 1 , и в этом примере я нахожу, что это верно для условий N = 1000 и далее. Более того, я мог выбрать любой фиксированный порог близости ϵ , независимо от того, насколько он строг (кроме ϵ = 0 , то есть термин фактически равен 1 ), и в конечном итоге условие | х н - х | < ϵ будет выполняться для всех терминов, выходящих за рамки определенного термина (символически: для n > N , где значение N0.0011N=1000ϵϵ=01|xn−x|<ϵn>NNзависит от того, насколько строго апа я выбрал). Для более сложных примеров, обратите внимание, что меня не всегда интересует, когда условие выполняется в первый раз - следующий термин может не подчиняться условию, и это хорошо, если я могу найти термин дальше по последовательности, для которой условие выполнено и остается выполненным для всех последующих условий. Я иллюстрирую это для х п = 1 + грех ( п )ϵ , который также сходится к1, сϵ=0,05снова заштриховано.xn=1+sin(n)n1ϵ=0.05
Теперь рассмотрим и последовательность случайных величин X n = ( 1 + 1X∼U(0,1). Это последовательность RV сX1=2X,X2=3Xn=(1+1n)XX1=2X,X3=4X2=32Xи тд. В каком смысле мы можем сказать, что это приближается ксамомуX?X3=43XX
Поскольку и X являются распределениями, а не просто числами, условие | X n - X | < Ε в настоящее время является событием : даже при фиксированном п и & epsi ; это может или не может произойти . Рассмотрение вероятности того, что оно будет достигнуто, приводит к сходимости по вероятности . Для X n p → X нам нужна дополнительная вероятность P ( | X n - X | ≥ ϵ )XnX|Xn−X|<ϵnϵXn→pXP(|Xn−X|≥ϵ)- интуитивно, вероятность того, что будет несколько отличаться (по крайней мере на ϵ ) от X, - стать сколь угодно малой для достаточно большого n . Для фиксированного ϵ это приводит к целой последовательности вероятностей , P ( | X 1 - X | ≥ ϵ ) , P ( | X 2 - X | ≥ ϵ ) , P ( | X 3 - X | ≥XnϵXnϵP(|X1−X|≥ϵ)P(|X2−X|≥ϵ) , ... и если эта последовательность вероятности сходятся к нулю (какпроисходит в нашем примере)то мы говорим , Х п сходится по вероятности к X . Обратите вниманиечто пределы вероятностей часто являются константами: напримерв регрессиях в эконометрике, мы видим Plim ( β ) = β по мере увеличения размера выборки п . Но здесь plim ( X n ) = X ∼ U ( 0 , 1 ) . По сути, сходимость по вероятности означает, что маловероятно, что XP(|X3−X|≥ϵ)…XnXplim(β^)=βnplim(Xn)=X∼U(0,1) и X будут сильно отличаться в зависимости от конкретной реализации - и я могу сделать так, чтобы вероятность того, что X n и X будут дальше, чем ϵ друг от друга, настолько мала, насколько мне нравится, при условии, что я выберу достаточно большое n .XnXXnXϵn
Другой смысл, в котором становится ближе к X, состоит в том, что их распределения выглядят все более похожими. Я могу измерить это, сравнивая их CDF. В частности, выберите некоторый x, при котором F X ( x ) = P ( X ≤ x ) является непрерывным (в нашем примере X ∼ U ( 0 , 1 ), так что его CDF непрерывен везде, и любой x сделает), и оцените CDF последовательности X n s там. Это производит другую последовательность вероятностей,XnXxFX(x)=P(X≤x)X∼U(0,1)xXn , P ( X 2 ≤ x ) , P ( X 3 ≤ x ) , … и эта последовательность сходится к P ( X ≤ x ) . CDF, оцененные в x для каждого из X n, становятся произвольно близкими к CDF X, оцененному в x . Если этот результат верен независимо от того, какой x мы выбрали, то X n сходится кP(X1≤x)P(X2≤x)P(X3≤x)…P(X≤x)xXnXxxXn в распределении. Оказывается, это происходит здесь, и мы не должны удивлятьсятак как сходимость по вероятности к X влечет сходимость по распределению к X . Обратите внимание, чтоэто не может быть случай, когда X n сходится по вероятности к конкретному невырожденному распределению, но сходится по распределению к константе. (Что могло быть причиной путаницы в первоначальном вопросе? Но обратите внимание на уточнение позже.)X XXXn
Для другого примера, пусть . Теперь у нас есть последовательность RVs,Y1∼U(1,2),Y2∼U(1,3Yn∼U(1,n+1n)Y1∼U(1,2),Y3∼U(1,4Y2∼U(1,32),…и ясно, что распределение вероятностей вырождается в пик приy=1. Теперь рассмотрим вырожденное распределениеY=1, под которым я подразумеваюP(Y=1)=1. Легко видеть, что для любогоϵ>0последовательностьP(|Yn-Y|≥ϵ)сходится к нулю, так чтоYnсходится кYY3∼U(1,43)…y=1Y=1P(Y=1)=1ϵ>0P(|Yn−Y|≥ϵ)YnYв вероятности. Как следствие, также должен сходиться к Y в распределении, что мы можем подтвердить, рассматривая CDF. Поскольку CDF F Y ( y ) для Y является прерывистым при y = 1, нам не нужно рассматривать CDF, оцененные при этом значении, но для CDF, оцененных при любом другом y, мы можем видеть, что последовательность P ( Y 1 ≤ y ) , P ( Y 2 ≤ y ) , P ( Y 3 ≤YnYFY(y)Yy=1yP(Y1≤y)P(Y2≤y) , … сходится к P ( Y ≤ y ), который равен нулю для y < 1 иравенединице для y > 1 . На этот раз, поскольку последовательность RV сходилась по вероятности к константе, она также сходилась по распределению к константе.P(Y3≤y)…P(Y≤y)y<1y>1
Некоторые последние уточнения:
- Хотя сходимость по вероятности подразумевает сходимость по распределению, обратное в целом неверно. То, что две переменные имеют одинаковое распределение, не означает, что они должны быть близки друг к другу. Для тривиального примера возьмем и Y = 1 - X . Тогда X и Y оба имеют абсолютно одинаковое распределение (с вероятностью 50%, каждый из которых равен нулю или единице) и последовательность X n = X, то есть последовательность, идущая X , X , X , X , …X∼Bernouilli(0.5)Y=1−XXYXn=XX,X,X,X,…тривиально сходится по распределению к (CDF в любой позиции в последовательности такой же, как CDF Y ). Но Y и X всегда едины, поэтому P ( | X n - Y | ≥ 0.5 ) = 1, поэтому не стремится к нулю, поэтому X n не сходится к Y по вероятности. Однако, если есть сходимость в распределении к константе , то это означает сходимость по вероятности к этой константе (интуитивно, в дальнейшем в последовательности станет маловероятно, что она будет далека от этой константы).YYYXP(|Xn−Y|≥0.5)=1XnY
- Как показывают мои примеры, сходимость по вероятности может быть постоянной, но не обязательно; сходимость в распределении также может быть постоянной. Невозможно сходиться по вероятности к константе, но сходиться по распределению к конкретному невырожденному распределению или наоборот.
- Возможно ли, что вы видели пример, в котором, например, вам сказали, что последовательность сходится с другой последовательностью Y n ? Возможно, вы не поняли, что это была последовательность, но раздача была бы, если бы это был дистрибутив, который также зависел от n . Возможно, что обе последовательности сходятся к константе (то есть вырожденному распределению). Ваш вопрос предполагает, что вам интересно, как конкретная последовательность RV может сходиться как к константе, так и к распределению; Интересно, это сценарий, который вы описываете?Xn Ynn
- Мое текущее объяснение не очень «интуитивно» - я собирался сделать интуицию графической, но у меня еще не было времени, чтобы добавить графики для RV.