Есть несколько способов, которыми можно разумно применить бутстрап. Два самых основных подхода - это то, что называется «непараметрическим» и «параметрическим» бутстрапом. Второй предполагает, что используемая модель (по существу) является правильной.
Давайте сосредоточимся на первом. Мы предполагаем , что у вас есть случайный образец распределенного в соответствии с функцией распределения . (Предполагается, что в противном случае требуются модифицированные подходы.) Пусть будет эмпирическим кумулятивным распределением функция. Большая часть мотивации для начальной загрузки исходит из нескольких фактов.X1,X2,…,XnFF^n(x)=n−1∑ni=11(Xi≤x)
Неравенство Дворецкого – Кифера – Вулфовица
P(supx∈R|F^n(x)−F(x)|>ε)≤2e−2nε2.
Что это свидетельствует о том , что эмпирическая функция распределения сходится равномерно к истинной функции распределения экспоненциально быстро по вероятности. Действительно, это неравенство в сочетании с леммой Бореля – Кантелли сразу показывает, что почти наверняка.supx∈R|F^n(x)−F(x)|→0
На форме нет дополнительных условий, гарантирующих эту сходимость.F
Эвристически, тогда, если нас интересует некоторый функционал гладкой функции распределения , то мы ожидаем, что будет близко к .T(F)T(F^n)T(F)
(Точечно) БеспристрастностьF^n(x)
Простая линейность ожидания и определение для каждого ,F^n(x)x∈R
EFF^n(x)=F(x).
Предположим, нас интересует среднее значение . Тогда беспристрастность эмпирической меры распространяется на беспристрастность линейных функционалов эмпирической меры. Итак,
μ=T(F)
EFT(F^n)=EFX¯n=μ=T(F).
Таким образом, в среднем является правильным, и поскольку быстро приближается к , то (эвристически) быстро приближается к .T(F^n)Fn^FT(F^n)T(F)
Чтобы построить доверительный интервал ( который, по сути, является тем, что представляет собой бутстрап ), мы можем использовать центральную предельную теорему, согласованность эмпирических квантилей и дельта-метод в качестве инструментов для перехода от простых линейных функционалов к более сложной статистике, представляющей интерес ,
Хорошие ссылки
- Б. Эфрон, Методы начальной загрузки: еще один взгляд на складной нож , Энн. Стат. том 7, нет. 1, 1–26.
- Б. Эфрон и Р. Тибширани . Введение в бутстрап , Чепмен-Холл, 1994.
- Г. А. Янг и Р. Л. Смит, Основы статистического вывода , издательство Кембриджского университета, 2005, глава 11 .
- А. В. ван дер Ваарт, Асимптотическая статистика , издательство Кембриджского университета, 1998, глава 23 .
- П. Бикель и Д. Фридман, Некоторые асимптотические теории для бутстрапа . Анна. Стат. том 9, нет. 6 (1981), 1196–1217.