Самозагрузка - это метод, позволяющий сделать вывод таким образом, чтобы не требовалась параметрическая форма распределения населения. Он не рассматривает исходную выборку так, как если бы это была популяция, даже если она включает выборку с заменой из исходной выборки. Предполагается, что выборка с заменой из исходной выборки размера n имитирует отбор выборки размера n из большей популяции. Он также имеет много вариантов, таких как бутстрап m из n, который повторно отбирает m времени из выборки размера n, где m <n. Хорошие свойства бутстрапа зависят от асимптотической теории. Как уже упоминали другие, бутстрап не содержит больше информации о населении, чем указано в исходной выборке. По этой причине иногда это не очень хорошо работает в небольших выборках.
Во второй книге «Методы начальной загрузки: руководство для практиков», опубликованной Wiley в 2007 году, я указываю на ситуации, в которых может произойти сбой начальной загрузки. Это включает в себя распределение, которое не имеет конечных моментов, небольшие размеры выборки, оценку экстремальных значений из распределения и оценку дисперсии в выборке обследования, где размер популяции составляет N, и берется большая выборка n. В некоторых случаях варианты начальной загрузки могут работать лучше, чем оригинальный подход. Это происходит с m из n начальной загрузкой в некоторых приложениях. В случае оценки частоты ошибок в дискриминантном анализе, 632 начальной загрузки является улучшением по сравнению с другими методами, включая другие методы начальной загрузки.
Причиной его использования является то, что иногда вы не можете полагаться на параметрические предположения, а в некоторых ситуациях загрузчик работает лучше, чем другие непараметрические методы. Он может быть применен к широкому кругу проблем, включая нелинейную регрессию, классификацию, оценку доверительного интервала, оценку смещения, корректировку p-значений и анализ временных рядов и многие другие.