Интуитивное объяснение сходимости в распределении и сходимости по вероятности


26

Какова интуитивная разница между случайной величиной, сходящейся по вероятности, и случайной величиной, сходящейся по распределению?

Я прочитал множество определений и математических уравнений, но это не очень помогает. (Пожалуйста, имейте в виду, я студент, изучающий эконометрику.)

Как случайная величина может сходиться к одному числу, но также сходиться к распределению?


1
«Как может случайная величина сходится к с одним номером , но также сходятся к в распределении?» - Думаю, вам было бы полезно выяснить, является ли ваше заблуждение в том, что RV в целом могут сходиться либо к отдельным числам, либо к целому распределению (меньше загадки, когда вы поймете, что «одно число» по сути является особым типом распределения) или ваша путаница заключается в том, как один RV может сходиться к константе в соответствии с одним способом конвергенции, но к распределению в соответствии с другим способом конвергенции?
Серебряная рыба

1
Как и @CloseToC, мне интересно, сталкивались ли вы с регрессиями, когда, с одной стороны, вам сказали, что "асимптотически нормальна", но с другой стороны, вам сказали, что она сходится к истинной . ; & betaβ^β
Серебряная рыба

@ Серебряная рыба, у меня нет на самом деле!
nicefella

Ответы:


25

Как случайное число может сходиться к константе?

Допустим, у вас есть шаров в коробке. Вы можете выбрать их по одному. После того, как вы выбрали k шаров, я спрашиваю вас: каков средний вес шаров в коробке? Ваш лучший ответ будет ˉ x k = 1Nk. Вы понимаетечто ˉ х ксама случайная величина? Это зависит от того, какиеkшаров ты выбрал первым.x¯k=1ki=1kxix¯kk

Теперь, если вы продолжите тянуть шары, в какой-то момент в коробке не останется никаких шаров, и вы получите .x¯Nμ

Итак, что у нас есть это случайная последовательность , которая сходится к константе ˉ х N = ц . Итак, ключом к пониманию вашей проблемы со сходимостью по вероятности является понимание того, что мы говорим о последовательности случайных величин, построенных определенным образом .

x¯1,,x¯k,,x¯N,x¯N,x¯N,
x¯N=μ

Далее, давайте получим равномерные случайные числа , где e i[ 0 , 1 ] . Давайте посмотрим на случайную последовательность ξ 1 , ξ 2 , , где ξ k = 1e1,e2,ei[0,1]ξ1,ξ2,. Ξкявляется случайной величиной, таквсе его условия являются случайными величинами. Мы не можем предсказать, что будетξk. Однако оказывается, что мы можем утверждать, что распределения вероятностейξkбудут все больше и больше походить на стандартную нормальN(0,1). Вот так сходятся распределения.ξk=1k12i=1k(ei12)ξkξkξkN(0,1)


1
Какова последовательность случайных величин в вашем первом примере после достижения N? Как оценивается лимит?
ekvall

Это просто интуиция. Представьте себе бесконечный прямоугольник, поэтому ваша оценка сходится к среднему значению для населенности µ . x¯μ
Аксакал

21

Не ясно, насколько интуитивно понятен читатель этого вопроса о сходимости чего-либо, не говоря уже о случайных переменных, поэтому я напишу, как будто ответ «очень мало». То , что могло бы помочь: а не думать « как может случайная величина сходится», спросите , как последовательность случайных величин может сходиться. Другими словами, это не просто одна переменная, а (бесконечно длинный!) Список переменных, и те, которые позже в списке, становятся все ближе и ближе к ... чему-то. Возможно, один номер, возможно, целый дистрибутив. Чтобы развить интуицию, нам нужно понять, что означает «все ближе и ближе». Причина, по которой существует так много способов сходимости для случайных величин, заключается в том, что существует несколько типов

Сначала давайте подведем итоги сходимости последовательностей действительных чисел. В мы можем использовать евклидово расстояние | х - у | измерить, насколько близко х к у . Рассмотрим x n = n + 1R |xy|xy . Тогда последовательностьх1,xn=n+1n=1+1n начинается 2 , 3x1,x2,x3,и я утверждаю, чтоxnсходится к1. Ясно, чтоxnстановитсяближек1, но также верно, чтоxnприближается к0.9. Например, начиная с третьего слагаемого, члены в последовательности находятся на расстоянии0,5или менее от0,9. Важно точто они получаютпроизвольноблизко к1, но не0,9. Никакие термины в последовательности никогда не встречаются в пределах0,05от0,92,32,43,54,65,xn1xn1xn0.90.50.910.90.050.9не говоря уже о том, чтобы оставаться так близко для последующих сроков. В отличие от равно 0,05 от 1 , и все последующие члены находятся в пределах 0,05 от 1 , как показано ниже.x20=1.050.0510.051

Сходимость (n + 1) / n к 1

Я мог бы быть более строгим и требовать, чтобы условия находились и оставались в пределах от 1 , и в этом примере я нахожу, что это верно для условий N = 1000 и далее. Более того, я мог выбрать любой фиксированный порог близости ϵ , независимо от того, насколько он строг (кроме ϵ = 0 , то есть термин фактически равен 1 ), и в конечном итоге условие | х н - х | < ϵ будет выполняться для всех терминов, выходящих за рамки определенного термина (символически: для n > N , где значение N0.0011N=1000ϵϵ=01|xnx|<ϵn>NNзависит от того, насколько строго апа я выбрал). Для более сложных примеров, обратите внимание, что меня не всегда интересует, когда условие выполняется в первый раз - следующий термин может не подчиняться условию, и это хорошо, если я могу найти термин дальше по последовательности, для которой условие выполнено и остается выполненным для всех последующих условий. Я иллюстрирую это для х п = 1 + грех ( п )ϵ , который также сходится к1, сϵ=0,05снова заштриховано.xn=1+sin(n)n1ϵ=0.05

Сходимость 1 + грех (n) / n к 1

Теперь рассмотрим и последовательность случайных величин X n = ( 1 + 1XU(0,1). Это последовательность RV сX1=2X,X2=3Xn=(1+1n)XX1=2X,X3=4X2=32Xи тд. В каком смысле мы можем сказать, что это приближается ксамомуX?X3=43XX

Поскольку и X являются распределениями, а не просто числами, условие | X n - X | < Ε в настоящее время является событием : даже при фиксированном п и & epsi ; это может или не может произойти . Рассмотрение вероятности того, что оно будет достигнуто, приводит к сходимости по вероятности . Для X n p X нам нужна дополнительная вероятность P ( | X n - X |ϵ )XnX|XnX|<ϵnϵXnpXP(|XnX|ϵ)- интуитивно, вероятность того, что будет несколько отличаться (по крайней мере на ϵ ) от X, - стать сколь угодно малой для достаточно большого n . Для фиксированного ϵ это приводит к целой последовательности вероятностей , P ( | X 1 - X |ϵ ) , P ( | X 2 - X |ϵ ) , P ( | X 3 - X |XnϵXnϵP(|X1X|ϵ)P(|X2X|ϵ) , ... и если эта последовательность вероятности сходятся к нулю (какпроисходит в нашем примере)то мы говорим , Х п сходится по вероятности к X . Обратите вниманиечто пределы вероятностей часто являются константами: напримерв регрессиях в эконометрике, мы видим Plim ( β ) = β по мере увеличения размера выборки п . Но здесь plim ( X n ) = X U ( 0 , 1 ) . По сути, сходимость по вероятности означает, что маловероятно, что XP(|X3X|ϵ)XnXplim(β^)=βnplim(Xn)=XU(0,1) и X будут сильно отличаться в зависимости от конкретной реализации - и я могу сделать так, чтобы вероятность того, что X n и X будут дальше, чем ϵ друг от друга, настолько мала, насколько мне нравится, при условии, что я выберу достаточно большое n .XnXXnXϵn

Другой смысл, в котором становится ближе к X, состоит в том, что их распределения выглядят все более похожими. Я могу измерить это, сравнивая их CDF. В частности, выберите некоторый x, при котором F X ( x ) = P ( X x ) является непрерывным (в нашем примере X U ( 0 , 1 ), так что его CDF непрерывен везде, и любой x сделает), и оцените CDF последовательности X n s там. Это производит другую последовательность вероятностей,XnXxFX(x)=P(Xx)XU(0,1)xXn , P ( X 2x ) , P ( X 3x ) , и эта последовательность сходится к P ( X x ) . CDF, оцененные в x для каждого из X n, становятся произвольно близкими к CDF X, оцененному в x . Если этот результат верен независимо от того, какой x мы выбрали, то X n сходится кP(X1x)P(X2x)P(X3x)P(Xx)xXnXxxXn в распределении. Оказывается, это происходит здесь, и мы не должны удивлятьсятак как сходимость по вероятности к X влечет сходимость по распределению к X . Обратите внимание, чтоэто не может быть случай, когда X n сходится по вероятности к конкретному невырожденному распределению, но сходится по распределению к константе. (Что могло быть причиной путаницы в первоначальном вопросе? Но обратите внимание на уточнение позже.)X XXXn

Для другого примера, пусть . Теперь у нас есть последовательность RVs,Y1U(1,2),Y2U(1,3YnU(1,n+1n)Y1U(1,2),Y3U(1,4Y2U(1,32),и ясно, что распределение вероятностей вырождается в пик приy=1. Теперь рассмотрим вырожденное распределениеY=1, под которым я подразумеваюP(Y=1)=1. Легко видеть, что для любогоϵ>0последовательностьP(|Yn-Y|ϵ)сходится к нулю, так чтоYnсходится кYY3U(1,43)y=1Y=1P(Y=1)=1ϵ>0P(|YnY|ϵ)YnYв вероятности. Как следствие, также должен сходиться к Y в распределении, что мы можем подтвердить, рассматривая CDF. Поскольку CDF F Y ( y ) для Y является прерывистым при y = 1, нам не нужно рассматривать CDF, оцененные при этом значении, но для CDF, оцененных при любом другом y, мы можем видеть, что последовательность P ( Y 1y ) , P ( Y 2y ) , P ( Y 3YnYFY(y)Yy=1yP(Y1y)P(Y2y) , сходится к P ( Y y ), который равен нулю для y < 1 иравенединице для y > 1 . На этот раз, поскольку последовательность RV сходилась по вероятности к константе, она также сходилась по распределению к константе.P(Y3y)P(Yy)y<1y>1

Некоторые последние уточнения:

  • Хотя сходимость по вероятности подразумевает сходимость по распределению, обратное в целом неверно. То, что две переменные имеют одинаковое распределение, не означает, что они должны быть близки друг к другу. Для тривиального примера возьмем и Y = 1 - X . Тогда X и Y оба имеют абсолютно одинаковое распределение (с вероятностью 50%, каждый из которых равен нулю или единице) и последовательность X n = X, то есть последовательность, идущая X , X , X , X , XBernouilli(0.5)Y=1XXYXn=XX,X,X,X,тривиально сходится по распределению к (CDF в любой позиции в последовательности такой же, как CDF Y ). Но Y и X всегда едины, поэтому P ( | X n - Y |0.5 ) = 1, поэтому не стремится к нулю, поэтому X n не сходится к Y по вероятности. Однако, если есть сходимость в распределении к константе , то это означает сходимость по вероятности к этой константе (интуитивно, в дальнейшем в последовательности станет маловероятно, что она будет далека от этой константы).YYYXP(|XnY|0.5)=1XnY
  • Как показывают мои примеры, сходимость по вероятности может быть постоянной, но не обязательно; сходимость в распределении также может быть постоянной. Невозможно сходиться по вероятности к константе, но сходиться по распределению к конкретному невырожденному распределению или наоборот.
  • Возможно ли, что вы видели пример, в котором, например, вам сказали, что последовательность сходится с другой последовательностью Y n ? Возможно, вы не поняли, что это была последовательность, но раздача была бы, если бы это был дистрибутив, который также зависел от n . Возможно, что обе последовательности сходятся к константе (то есть вырожденному распределению). Ваш вопрос предполагает, что вам интересно, как конкретная последовательность RV может сходиться как к константе, так и к распределению; Интересно, это сценарий, который вы описываете?Xn Ynn
  • Мое текущее объяснение не очень «интуитивно» - я собирался сделать интуицию графической, но у меня еще не было времени, чтобы добавить графики для RV.

16

На мой взгляд, все существующие ответы несут полезную информацию, но они не дают четкого различия между двумя способами конвергенции.

Пусть , n = 1 , 2 , и Y - случайные величины. Для интуиции представьте, что X n присваиваются их значения в каком-то случайном эксперименте, который немного меняется для каждого n , давая бесконечную последовательность случайных переменных, и предположим, что Y получает свое значение, назначенное каким-то другим случайным экспериментом.Xnn=1,2,YXnnY

Если , мы по определению имеем, что вероятность того, что Y и X n отличаются друг от друга на какое-то сколь угодно малое значение, приближается к нулю при n для столь же малого количества, как вам нравится. Грубо говоря, далеко в последовательности X n мы уверены, что X n и Y примут значения, очень близкие друг к другу.XnpYYXnnXnXnY

С другой стороны, если мы имеем только сходимость по распределению и не сходимости по вероятности, то мы знаем , что при больших , Р ( Х пх ) почти такая же , как P ( Y х ) , практически для любого х . Обратите внимание, что это ничего не говорит о том, насколько близки значения X n и Y друг к другу. Например, если Y N ( 0 , 10 10 ) , и, таким образом, X nnP(Xnx)P(Yx)xXnYYN(0,1010)Xnтакже распределяется примерно так же для больших , тогда кажется интуитивно вероятным, что значения X n и Y будут сильно отличаться в любом данном наблюдении. В конце концов, если нет никаких ограничений на них, кроме сходимости в распределении, они вполне могут по всем практическим причинам быть независимыми N ( 0 , 10 10 ) переменных.nXnYN(0,1010)

(В некоторых случаях может даже не иметь смысла сравнивать и Y , возможно, они даже не определены в одном и том же вероятностном пространстве. Однако это более техническое замечание.)XnY


1
(+1) Вам даже не нужно, чтобы менялся - я собирался добавить некоторые подробности об этом к своему ответу, но решил отказаться от него по соображениям длины. Но я думаю, что это стоит сделать. Xn
Серебряная рыба

12

Что я не понимаю, так это как случайная переменная может сходиться к одному числу, но также сходиться к распределению?

Если вы изучаете эконометрику, вы, вероятно, задаетесь вопросом об этом в контексте регрессионной модели. Это сходится к вырожденному распределению, к константе. Но что-то еще имеет невырожденное предельное распределение.

сходится по вероятности кресли необходимые допущения будут выполнены. Это означает, что, выбрав достаточно большой размер выборкиN, оценщик будет настолько близок, насколько мы хотим к истинному параметру, с вероятностью того, что он будет дальше, настолько мал, насколько мы хотим. Если вы думаете о построении гистограммы бета пдля различныхп, токонечном итоге будет только шипцентру нар.β^nβNβ^nnβ

В каком смысле β п сходится по распределению? Это также сходится к константе. Не для нормально распределенной случайной величины. Если вычислять дисперсию р п вы видите , что она уменьшается с п . Таким образом, в конечном итоге он будет стремиться к нулю при достаточно большом n , поэтому оценщик переходит к константе. Что сходится к нормально распределенной случайной переменнойβ^nβ^nnn

. Если вы возьмете дисперсию, вы увидите, что она не сжимается (и не увеличивается) сn. В очень больших выборках это будет приблизительноN(0,σ2)при стандартных допущениях. Затем мы можем использовать это приближение аппроксимировать распределение & beta ; пв этой большой выборке.n(β^nβ)nN(0,σ2)β^n

Но вы правы , что предельное распределение бета п является также постоянным.β^n


1
Посмотрите на это как «глядя на с увеличительным стеклом», с увеличением, увеличивающимся с n со скоростью βn^n . n
kjetil b halvorsen

7

Позвольте мне дать очень короткий ответ, используя несколько очень простых примеров.

Сходимость в распределении

Пусть , для всех n, тогдаXXnN(1n,1) сходится к X N ( 0 , 1 ) по распределению. Однако случайность в реализации X n не меняется со временем. Если мы должны предсказать значение X n , ожидание нашей ошибки не меняется со временем.XnXN(0,1)XnXn

Сходимость по вероятности

Теперь рассмотрим случайную величину которая принимает значение 0 с вероятностью 1 - 1Yn0 и1 впротивном случае. Посколькуnуходит в бесконечность, мы все больше и больше уверены, чтоYnбудет равно011n1nYn0 . Следовательно, мы говорим, что сходится по вероятности к 0 . Обратите внимание, что это также означает, что Y n сходится по распределению к 0 .Yn0Yn0

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.