Метод начальной загрузки получил широкое распространение в последние годы, я также часто его использую, особенно потому, что обоснование довольно интуитивно понятно.
Но это одна вещь, которую я не понимаю. Почему Efron решил выполнить повторную выборку с заменой, а не просто субсэмплирование путем случайного включения или исключения отдельных наблюдений?
Я думаю, что случайная подвыборка имеет одно очень хорошее качество, которое идеально отражает реальную жизненную ситуацию, в которой наблюдения, которые мы проводим в нашем исследовании, являются подмножеством гипотетической популяции. Я не вижу преимущества в увеличении количества наблюдений во время повторной выборки. В реальном контексте ни одно наблюдение не похоже на другое, особенно для сложных многомерных ситуаций.