Запись в Википедии о начальной загрузке очень хороша:
http://en.wikipedia.org/wiki/Bootstrapping_%28statistics%29
Самая распространенная причина, по которой применяется начальная загрузка, заключается в том, что форма основного распределения, из которого берется выборка, неизвестна. Традиционно статистики предполагают нормальное распределение (по очень веским причинам, связанным с центральной предельной теоремой), но статистические данные (такие как стандартное отклонение, доверительные интервалы, расчеты мощности и т. Д.), Оцененные с помощью теории нормального распределения, являются только строго действительными, если базовое распределение населения нормальный.
Путем многократной повторной выборки самой выборки начальная загрузка позволяет получить оценки, которые не зависят от распределения. Традиционно каждая «повторная выборка» исходной выборки случайным образом выбирает то же количество наблюдений, что и в исходной выборке. Однако они выбраны с заменой. Если выборка имеет N наблюдений, каждая повторная выборка начальной загрузки будет иметь N наблюдений, при этом многие из исходной выборки будут повторены, а многие исключены.
Интересующий параметр (например, отношение шансов и т. Д.) Может быть затем оценен из каждой начальной загрузки. Повторение начальной загрузки, скажем, 1000 раз, позволяет оценить «медиану» и 95% доверительный интервал по статистике (например, отношение шансов), выбрав 2,5-й, 50-й и 97,5-й процентили.