Использование начальной загрузки для получения выборочного распределения 1-го процентиля


9

У меня есть образец (размером 250) из популяции. Я не знаю распределение населения.

Основной вопрос: я хочу получить точечную оценку 1- го процента населения, а затем я хочу 95% доверительный интервал вокруг моей точечной оценки.

Моя точечная оценка будет выборкой 1- го процентиля. Я обозначаю это .x

После этого я пытаюсь построить доверительный интервал вокруг точечной оценки. Интересно, имеет ли смысл использовать здесь начальную загрузку? Я очень неопытен с начальной загрузкой, так что извините, если я не могу использовать соответствующую терминологию и т. Д.

Вот как я пытался это сделать. Я рисую 1000 случайных образцов с заменой из моего исходного образца. Я получаю 1- й процентиль от каждого из них. Таким образом, у меня 1000 баллов - «1- й процентиль». Я смотрю на эмпирическое распределение этих 1000 точек. Я обозначаю среднее из него . Я обозначаю «смещение» следующим образом: смещение = x m e a n - x . Я беру 2,5- й процентиль и 97,5- й процентиль из 1000 пунктов, чтобы получить нижний и верхний пределы того, что я называю 95% -ным доверительным интервалом около 1- гоxmeanbias=xmeanxПроцент оригинального образца. Я обозначаю эти точки и х 0,975 .x0.025x0.975

Последним оставшимся шагом является адаптация этого доверительного интервала к 1- му процентилю населения, а не к 1- му процентилю исходной выборки . Таким образом, я принимаю в качестве нижнего предела, а x - bias + ( x 0,975 - x m e a n ) в качестве верхнего предела 95% доверительного интервала вокруг оценки точки 1 населенияxbias(xmeanx0.025)xbias+(x0.975xmean)С- перцентиль. Этот последний интервал - то, что я искал.

Решающий момент, на мой взгляд, имеет ли смысл использовать бутстрапе 1 - го -percentile что довольно близко к хвосту неизвестного исходного распределения населения. Я подозреваю, что это может быть проблематично; подумайте об использовании начальной загрузки для построения доверительного интервала вокруг минимума (или максимума).

Но, возможно, этот подход имеет недостатки? Пожалуйста, дайте мне знать.

РЕДАКТИРОВАТЬ:

xbias

xx(xmeanx0.025)x+(x0.975xmean)

Так имеет ли смысл предполагать, что 1- й процентиль выборки является предвзятой оценкой 1- го процентиля населения? И если нет, верно ли мое альтернативное решение?


Это не относится непосредственно к вопросу начальной загрузки, но может быть полезно для вас: onlinecourses.science.psu.edu/stat414/node/231
shadowtalker

Ответы:


11

n1(11/n)n1exp(1)=63.2%exp(1)exp(2)=23.3%

n


Ответ полезен, но я хотел бы получить представление о том, насколько близок 1-й процентиль к минимуму в отношении поведения начальной загрузки? Я предполагаю, что в очень больших выборках 1-й процентиль можно считать «далеким» от минимума, и проблемы, перечисленные выше, можно игнорировать, в то время как в небольших выборках 1-й процентиль будет сам минимум, и проблемы будут иметь большое значение. Таким образом, мы где-то посередине. Я предполагаю, что размер моей выборки в 250 наблюдений следует считать довольно маленьким в этом отношении.
Ричард Харди
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.