Этот вопрос был вызван тем, что я прочитал в этом учебнике по статистике для выпускников, а также (независимо) услышал во время этой презентации на статистическом семинаре. В обоих случаях утверждение было следующим: «поскольку размер выборки довольно мал, мы решили выполнить оценку с помощью начальной загрузки вместо (или вместе с) этого параметрического метода ».
Они не вдаваться в подробности, но , вероятно, рассуждали следующим образом : метод принимает данные следуют определенной параметрическое распределение . На самом деле распределение не совсем , но это нормально, если размер выборки достаточно велик. Поскольку в этом случае размер выборки слишком мал, давайте переключимся на (непараметрический) загрузчик, который не делает никаких предположений о распределении. Задача решена!D D
На мой взгляд, это не то, для чего нужен бутстрап. Вот как я это вижу: начальная загрузка может дать преимущество, когда более или менее очевидно, что данных достаточно, но нет решения в закрытой форме для получения стандартных ошибок, p-значений и аналогичной статистики. Классическим примером является получение КИ для коэффициента корреляции по выборке из двумерного нормального распределения: решение в замкнутой форме существует, но оно настолько запутанно, что начальная загрузка проще. Тем не менее, ничто не подразумевает, что бутстрап может как-то помочь избежать небольшого размера выборки.
Правильно ли мое восприятие?
Если вам интересен этот вопрос, у меня есть еще один, более конкретный вопрос о начальной загрузке:
Bootstrap: проблема переоснащения
PS Я не могу не поделиться одним вопиющим примером «бутстрапного подхода». Я не раскрываю имя автора, но он один из «квантов» старшего поколения, который написал книгу о количественных финансах в 2004 году. Пример взят из этого.
Рассмотрим следующую проблему: предположим, у вас есть 4 актива и 120 ежемесячных наблюдений за возвращением для каждого. Цель состоит в том, чтобы построить объединенный 4-мерный cdf годовых доходов. Даже для одного актива эта задача вряд ли достижима только с 10 ежегодными наблюдениями, не говоря уже об оценке 4-мерного cdf. Но не волнуйтесь, «бутстрап» поможет вам: возьмите все доступные 4-мерные наблюдения, произведите повторную выборку 12 с заменой и составьте их, чтобы построить единый «загруженный» 4-мерный вектор годовой доходности. Повторите это 1000 раз, и, о чудо, вы получили «образец самозагрузки» из 1000 годовых доходов. Используйте это как образец iid размером 1000 для оценки cdf или любого другого вывода, который можно извлечь из тысячелетней истории.