Существуют некоторые трудности, которые являются общими для всех непараметрических оценок начальной загрузки доверительных интервалов (CI), некоторые из них больше связаны как с «эмпирическими» (называемыми «базовыми» в boot.ci()
функции boot
пакета R , так и в [1] ). и оценки «процентили» CI (как описано в ссылке 2 ), а также некоторые, которые могут усугубляться с помощью процентилей CI.
TL; DR : в некоторых случаях оценки процентили начальной загрузки CI могут работать адекватно, но если некоторые допущения не выполняются, процентиль CI может быть наихудшим выбором, а эмпирический / базовый бутстрап - наихудшим. Другие оценки начальной загрузки CI могут быть более надежными, с лучшим охватом. Все может быть проблематично. Просмотр диагностических графиков, как всегда, помогает избежать потенциальных ошибок, возникающих, просто принимая выходные данные программной процедуры.
Настройка начальной загрузки
В общем, следуя терминологии и аргументам работы . 1 , мы имеем выборку данных взяты из независимых и одинаково распределенных случайных величин Y я делить интегральную функцию распределения F . Эмпирическая функция распределения (ФРЭ) , построенная из образца данных является F . Нас интересует характеристика θ популяции, оцененная статистикой T , значение которой в выборке равно t . Нам хотелось бы знать, насколько хорошо T оценивает θy1,...,ynYiFF^θTtTθНапример, распределение .(T−θ)
Непараметрические бутстраповский использует выборку из EDF F , чтобы имитировать выборки из F , принимая R образцов , каждый из размера п с заменой от у я . Значения, рассчитанные по образцам начальной загрузки, обозначены «*». Например, статистика T, рассчитанная на образце начальной загрузки j, дает значение T ∗ j .F^FRnyiTT∗j
Эмпирические / базовые и процентильные контрольные CI начальной загрузки
Эмпирическая / базовая самозагрузки использует распределение среди R бутстраповских выборок из F , чтобы оценить распределение ( Т - & thetas ; ) в пределах популяции , описываемой F самой. Таким образом, его оценки CI основаны на распределении ( T ∗ - t ) , где t - значение статистики в исходной выборке.(T∗−t)RF^( Т- θ )F( Т*- т )T
Этот подход основан на фундаментальном принципе начальной загрузки ( ссылка 3 ):
Население относится к выборке, как выборка к выборкам начальной загрузки.
В процентильной начальной загрузке вместо этого используются квантили самих значений для определения КИ. Эти оценки могут быть совершенно разными, если в распределении ( T - θ ) наблюдается перекос или смещение .T*J( Т- θ )
Скажем, что существует наблюдаемое смещение такое, что:
ˉ T ∗ = t + B ,В
T¯*= t + B ,
где - среднее значение T ∗ j . Для конкретности, скажем, что 5-й и 95-й процентили T ∗ j выражаются как ˉ T ∗ - δ 1 и ˉ T ∗ + δ 2 , где ˉ T ∗ - среднее значение по образцам начальной загрузки, а δ 1 , δ 2 - это каждый положительный и потенциально различный, чтобы учесть перекос. Оценки, основанные на 5-м и 95-м CI-процентилях, будут непосредственно даны соответственно:T¯*T*JT*JT¯*- δ1T¯*+ δ2T¯*δ1, δ2
T¯*- δ1= t + B - δ1; T¯*+ δ2= t + B + δ2,
Оценки CI 5-го и 95-го процентиля эмпирическим / базовым методом начальной загрузки будут соответственно (см . 1 , уравнение 5.6, стр. 194):
2 т - ( т¯*+ δ2) = t - B - δ2; 2 т - ( т¯*- δ1) = t - B + δ1,
Таким образом, основанные на процентилях КИ неверно воспринимают смещение и изменяют направления потенциально асимметричных позиций доверительных границ вокруг двукратно смещенного центра . Процентные CI от начальной загрузки в таком случае не представляют распределение .( Т- θ )
Это поведение хорошо иллюстрируется на этой странице для начальной загрузки статистики с таким отрицательным смещением, что исходная выборочная оценка ниже 95% ДИ, основанных на эмпирическом / базовом методе (который непосредственно включает соответствующую коррекцию смещения). 95% ДИ, основанные на методе процентили, расположенном вокруг дважды отрицательно смещенного центра, на самом деле оба ниже даже оценки отрицательно смещенной точки из исходного образца!
Нужно ли использовать процентильный бутстрап?
Это может быть завышением или занижением, в зависимости от вашей точки зрения. Если вы можете задокументировать минимальное смещение и перекос, например, визуализируя распределение с помощью гистограмм или графиков плотности, начальная загрузка процентиля должна обеспечивать по существу тот же CI, что и эмпирический / базовый CI. Возможно, они оба лучше, чем простое нормальное приближение к КИ.( Т*- т )
Ни один из подходов, однако, не обеспечивает точность покрытия, которая может быть обеспечена другими подходами начальной загрузки. Эфрон с самого начала осознавал потенциальные ограничения процентильных КИ, но сказал: «В основном мы будем рады позволить различным степеням успеха примеров говорить сами за себя». ( Ссылка 2 , страница 3)
Последующая работа, обобщенная, например, Дичиччо и Эфроном ( ссылка 4 ), разработала методы, которые «улучшаются на порядок по точности стандартных интервалов», предоставляемые эмпирическим / базовым или процентильным методами. Таким образом, можно утверждать, что ни эмпирический / базовый, ни процентильный методы не должны использоваться, если вы заботитесь о точности интервалов.
В крайних случаях, например, выборка напрямую из логнормального распределения без преобразования, никакие начальные оценки CI не могут быть надежными, как отметил Фрэнк Харрелл .
Что ограничивает надежность этих и других загрузочных КИ?
Некоторые проблемы могут привести к ненадежности загружаемых КИ. Некоторые применимы ко всем подходам, другие могут быть смягчены с помощью подходов, отличных от эмпирических / базовых или процентильных методов.
Первый, вообще, вопрос, насколько хорошо эмпирическое распределение F представляет распределение населения F . Если этого не произойдет, то никакой метод начальной загрузки не будет надежным. В частности, начальная загрузка для определения чего-либо, близкого к экстремальным значениям распределения, может быть ненадежной. Эта проблема обсуждается в другом месте на этом сайте, например, здесь и здесь . Немногочисленные, дискретные значения , доступные в хвостах F для любого конкретного образца не могут представлять собой хвосты непрерывного F очень хорошо. Экстремальный, но иллюстративный случай - попытка использовать начальную загрузку для оценки статистики максимального порядка случайной выборки из униформы.F^FF^FРаспределение U [ 0 , θ ] , как хорошо объясненоздесь. Обратите внимание, что загруженные 95% или 99% CI сами находятся в хвостах распределения и, следовательно, могут страдать от такой проблемы, особенно с небольшими размерами выборки.U[ 0 , θ ]
Во- вторых, нет никаких гарантий того, что выборка любого количества из F будет иметь такое же распределение , как отсчётов от F . И все же это предположение лежит в основе основополагающего принципа начальной загрузки. Количества с этим желательным свойством называются основными . Как объясняет AdamO :F^F
Это означает, что если базовый параметр изменяется, форма распределения смещается только на постоянную величину, и масштаб не обязательно изменяется. Это сильное предположение!
Например, если есть смещение, важно знать , что выборка из вокруг θ такое же , как выборка из F вокруг т . И это особая проблема в непараметрической выборке; как исх. 1 помещает это на страницу 33:FθF^T
В непараметрических задачах ситуация сложнее. В настоящее время маловероятно (но не строго невозможно), что любое количество может быть точно ключевым.
Так что лучшее, что обычно возможно, - это приближение. Эта проблема, однако, часто может быть решена адекватно. Это можно оценить , насколько близко сэмпла количество является Pivotal, например , с помощью шарнирных участков в соответствии с рекомендациями Кенти и др . Они могут показать, как распределения загрузочных оценок меняются в зависимости от t , или насколько хорошо преобразование h обеспечивает величину ( h ( T ∗ ) - h ( t ) ), которая является ключевой. Методы для улучшенных загруженных CI могут попытаться найти преобразование h( Т*- т )Tчас( ч ( Т*) - ч ( т ) )частакой, что ближе к основному для оценки КИ в преобразованной шкале, затем преобразуйте обратно в исходную шкалу.( ч ( Т*) - ч ( т ) )
boot.ci()
Функция обеспечивает стьюдентизированную самозагрузку КИ ( так называемого «bootstrap- т » с помощью DiCiccio и Эфрона ) и КУ (смещения корректируются и ускоряются, когда «ускорение» имеет дело с перекосом) , которые являются «вторым порядком точности» в том , что разница между желаемым и достигнутым охватом α (например, 95% ДИ) составляет порядка n - 1 , в отличие только от точности первого порядка (порядка n - 0,5 ) для эмпирического / основного и процентильного методов ( ссылка 1 , с. 212-3; ссылка 4B CaαN- 1N- 0,5). Эти методы, однако, требуют отслеживания отклонений в каждой из загруженных выборок, а не только отдельных значений используемых этими более простыми методами.T*J
В крайних случаях, возможно, придется прибегнуть к самозагрузке внутри самих самозагруженных выборок, чтобы обеспечить адекватную настройку доверительных интервалов. Этот «Двойной бутстрап» описан в Разделе 5.6 . 1 , вместе с другими главами этой книги, предлагающими способы минимизации его экстремальных вычислительных требований.
Дэвисон, А.С. и Хинкли, Д.В. Методы начальной загрузки и их применение, издательство Кембриджского университета, 1997 .
Efron, B. Bootstrap Методы: еще один взгляд на Дженниф, Энн. Statist. 7: 1-26, 1979 .
Fox, J. and Weisberg, S. Бутстрапинговые регрессионные модели в R. Приложение к R Companion к прикладной регрессии, второе издание (Sage, 2011). Версия от 10 октября 2017 года .
DiCiccio, TJ и Efron, B. Начальные доверительные интервалы. Стат. Sci. 11: 189-228, 1996 .
Canty, AJ, Davison, AC, Hinkley, DV, и Ventura, V. Bootstrap диагностика и средства. Может. J. Stat. 34: 5-27, 2006 .