Моделирование сходимости по вероятности к константе


9

Асимптотические результаты не могут быть подтверждены компьютерным моделированием, потому что они являются утверждениями, включающими понятие бесконечности. Но мы должны иметь возможность почувствовать, что вещи действительно идут так, как нам подсказывает теория.

Рассмотрим теоретический результат

ИтNп(|ИксN|>ε)знак равно0,ε>0

где ИксN является функцией от N случайных величин, скажем, одинаково и независимо распределенных. Это говорит о том, что ИксN сходится по вероятности к нулю. Примером архетипа здесь, я думаю, является случай, когда ИксN - среднее значение выборки минус общее ожидаемое значение iidrv's выборки,

ИксNзнак равно1NΣязнак равно1NYя-Е[Y1]

ВОПРОС: Как мы можем убедительно показать кому-то, что указанное выше соотношение «материализуется в реальном мире», используя результаты компьютерного моделирования из обязательно конечных выборок?

Обратите внимание, что я специально выбрал сходимость к константе .

Ниже я приведу свой подход в качестве ответа, и я надеюсь на лучшие.

ОБНОВЛЕНИЕ: Что-то в моей голове беспокоило меня - и я узнал что. Я выкопал старый вопрос, где в комментариях к одному из ответов шла самая интересная дискуссия . Там @Cardinal предоставил пример оценки, что она непротиворечива, но ее дисперсия остается ненулевой и конечной асимптотически. Таким образом, более жесткий вариант моего вопроса становится следующим: как с помощью моделирования мы показываем, что статистика сходится по вероятности к константе, когда эта статистика асимптотически поддерживает ненулевую и конечную дисперсию?


@Glen_b Исходя из вас, это эквивалент значка. Спасибо.
Алекос Пападопулос

Я думал об этом время от времени, и все, что я придумал, это аргумент «концентрация вокруг среднего»; Я надеюсь, что некоторые умные люди здесь успеют написать что-нибудь интересное! (+1 конечно!)
ekvall

Ответы:


2

Я думаю о как функция распределения (дополнительная в конкретном случае). Поскольку я хочу использовать компьютерное моделирование, чтобы продемонстрировать, что все происходит так, как нам подсказывает теоретический результат, мне нужно построить эмпирическую функцию распределенияили эмпирическое распределение относительной частоты, а затем каким-то образом показать, что при увеличении значения сосредоточиться "больше и больше" до нуля. | X n | п | X n |п()|ИксN|N|ИксN|

Чтобы получить эмпирическую функцию относительной частоты, мне нужно (намного) больше, чем одна выборка, увеличивающаяся в размере, потому что с увеличением размера выборки распределениеизменения для каждого разные . N|ИксN|N

Поэтому мне нужно генерировать из распределения 's выборок «параллельно», скажем, в тысячах, каждый из которых имеет некоторый начальный размер , скажем, в десятках тысяч. Мне нужно тогда вычислить значениеиз каждого образца (и для того же ), т.е. получить набор значений . m m n n | X n | n { | х 1 н | , | х 2 н | , . , , , | х м н | }YяммNN|ИксN|N{|Икс1N|,|Икс2N|,,,,,|ИксмN|}

Эти значения могут быть использованы для построения эмпирического распределения относительной частоты. Веря в теоретический результат, я ожидаю, что «много» значенийбудет "очень близко" к нулю, но, конечно, не все. |ИксN|

Итак, чтобы показать, что значениядействительно продвигайтесь к нулю в больших и больших числах, мне пришлось бы повторить процесс, увеличив размер выборки, скажем, до , и показать, что теперь концентрация до нуля «увеличилась». Очевидно, чтобы показать, что он увеличился, нужно указать эмпирическое значение для .2 n ϵ|ИксN|2Nε

Будет ли этого достаточно? Можем ли мы как-то формализовать это «увеличение концентрации»? Может ли эта процедура, если она выполняется в несколько этапов «увеличения размера выборки», причем один из них ближе к другому, дать нам некоторую оценку фактической скорости сходимости , то есть что-то вроде «эмпирической вероятностной массы, которая движется ниже порогового значения за каждый шаг "скажем, тысячи? N

Или изучите значение порога, для которого, скажем, % вероятности лежит ниже, и посмотрите, как это значение уменьшается по величине?ϵ90ε

ПРИМЕР

Рассмотрим как и так U ( 0 , 1 )YяU(0,1)

|ИксN|знак равно|1NΣязнак равно1NYя-12|

Сначала мы генерируем выборок размером каждая. Эмпирическое распределение относительной частотыпохоже п = 10 , 000 | X 10 , 000 |мзнак равно1,000Nзнак равно10,000|Икс10,000|введите описание изображения здесь

и отметим, что % значенийменьше . | X 10 , 000 | 0.004615590,10|Икс10,000|0.0046155

Затем я увеличиваю размер выборки до . Теперь эмпирическое распределение относительной частотывыглядит, и мы отмечаем, что % значенийниже . В качестве альтернативы, теперь % значений падают ниже .| X 20 , 000 | 91,80 | X 20 , 000 | 0,0037101 98,00 0,0045217Nзнак равно20,000|Икс20,000|введите описание изображения здесь91,80|Икс20,000|0.003710198,000.0045217

Вас убедит такая демонстрация?


3
101000

1
@whuber То, что ты пишешь, звучит очень интересно. Были ли эти модели, о которых вы упомянули, основаны на некоторых исходных реальных данных, из каких распределений были получены оценки, а затем были получены дополнительные искусственные данные? Или это было искусственно с самого начала? Если конфиденциальность не является проблемой, и время позволяет, я лично очень хотел бы увидеть ваш ответ, дающий некоторое представление о том, как развивались эти симуляции и почему остались сомнения.
Алекос Пападопулос

1
N(1/2)(N,1/2)N(N/2,N/2)1000

@ Whuber Спасибо, я буду работать над этим. Кстати, упомянутый вами вопрос, ответ на него и ваши комментарии заставили меня глубже исследовать как асимптотическое распределение дисперсии выборки из ненормальных выборок, так и применимость теоремы Слуцкого таким образом, что используется в ответе. Я надеюсь, что со временем у меня будут какие-то результаты.
Алекос Пападопулос
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.