Это, вероятно, более техническое объяснение, предназначенное для людей, которые понимают некоторые статистические данные и математику (по крайней мере, исчисление). Вот слайд из курса по начальной загрузке, который я преподавал некоторое время назад:
Конечно, нужны некоторые объяснения. - это процедура для получения статистики из существующих данных (или, если быть точным, с технической точки зрения, функционала от функции распределения до действительных чисел; например, среднее значение равно , где для функции распределения выборки , понимается как точечная масса в точке выборки). В популяции, обозначаемой , применение дает интересующий параметр . Теперь мы взяли образец (первая стрелка вверху) и имеем эмпирическую функцию распределения - к ней мы применяем чтобы получить оценкуTE[X]=∫xdFFn()dFF()TθFn()Tθ^n . Интересно, насколько это далеко от ? Какое распределение может иметь случайное количество вокруг ? Это вопросительный знак в левом нижнем углу диаграммы, и на этот вопрос пытается ответить начальная загрузка. Если перефразировать точку зрения Ганга, то это не вопрос о населении, а вопрос о конкретной статистике и ее распределении.θθ^nθ
Если бы мы могли повторить нашу процедуру выборки, мы могли бы получить это распределение и узнать больше. Ну, это обычно за пределами наших возможностей. Однако если
- Fn достаточно близко к , в подходящем смысле, иF
- отображение достаточно гладкое, т. е. если мы возьмем небольшие отклонения от , результаты будут сопоставлены с числами, близкими к ,TF()θ
мы можем надеяться, что процедура начальной загрузки будет работать. А именно, мы притворяемся, что наше распределение а не , и с этим мы можем развлекать все возможные выборки - и будет таких выборок, что практично только для . Позвольте мне повторить еще раз: загрузчик работает для создания выборочного распределения вокруг «истинного» параметра , и мы надеемся, что при двух вышеупомянутых условиях это распределение выборки будет информативным о распределении выборки из вокруг :Fn()F()nnn≤5θ^∗nθ^nθ^nθ
θ^∗n to θ^n is like θ^n to θ
Теперь, вместо того, чтобы идти одним путем вдоль стрелок и терять некоторую информацию / точность вдоль этих стрелок, мы можем вернуться и что-то сказать об изменчивости вокруг .θ^∗nθ^n
Вышеуказанные условия изложены в техническом изложении в книге Холла (1991) . Понимание исчисления, которое я сказал, может потребоваться для того, чтобы посмотреть на этот слайд, - это второе предположение о гладкости: в более формальном языке функционал должен обладать слабой производной. Первое условие, конечно, асимптотическое утверждение: чем больше ваша выборка, тем ближе должен быть к ; и расстояния от до должны быть того же порядка, что и от до . Эти условия могут нарушаться, и они нарушаютTFnFθ^∗nθ^nθ^nθв ряде практических ситуаций с достаточно странными статистическими данные и / или схемой выборки , которые не производят эмпирические распределения, которые достаточно близки к .F
Теперь, откуда взялись эти 1000 сэмплов, или какое-то магическое число? Это связано с нашей неспособностью отобрать все выборок, поэтому мы просто берем их случайное подмножество. Самая правая «симулирующая» стрелка указывает на другое приближение, которое мы делаем на нашем пути, чтобы получить распределение вокруг , и это означает, что наше моделирование методом Монте-Карло - достаточно хорошее приближение полного начального дистрибутива вокруг .thetas ; п & thetas ; & thetas ; ( * г ) п & thetas ; * п & thetas ; пnnθ^nθθ^(∗r)nθ^∗nθ^n