У меня есть образец (размером 250) из популяции. Я не знаю распределение населения.
Основной вопрос: я хочу получить точечную оценку 1- го процента населения, а затем я хочу 95% доверительный интервал вокруг моей точечной оценки.
Моя точечная оценка будет выборкой 1- го процентиля. Я обозначаю это .
После этого я пытаюсь построить доверительный интервал вокруг точечной оценки. Интересно, имеет ли смысл использовать здесь начальную загрузку? Я очень неопытен с начальной загрузкой, так что извините, если я не могу использовать соответствующую терминологию и т. Д.
Вот как я пытался это сделать. Я рисую 1000 случайных образцов с заменой из моего исходного образца. Я получаю 1- й процентиль от каждого из них. Таким образом, у меня 1000 баллов - «1- й процентиль». Я смотрю на эмпирическое распределение этих 1000 точек. Я обозначаю среднее из него . Я обозначаю «смещение» следующим образом: смещение = x m e a n - x . Я беру 2,5- й процентиль и 97,5- й процентиль из 1000 пунктов, чтобы получить нижний и верхний пределы того, что я называю 95% -ным доверительным интервалом около 1- гоПроцент оригинального образца. Я обозначаю эти точки и х 0,975 .
Последним оставшимся шагом является адаптация этого доверительного интервала к 1- му процентилю населения, а не к 1- му процентилю исходной выборки . Таким образом, я принимаю в качестве нижнего предела, а x - bias + ( x 0,975 - x m e a n ) в качестве верхнего предела 95% доверительного интервала вокруг оценки точки 1 населенияС- перцентиль. Этот последний интервал - то, что я искал.
Решающий момент, на мой взгляд, имеет ли смысл использовать бутстрапе 1 - го -percentile что довольно близко к хвосту неизвестного исходного распределения населения. Я подозреваю, что это может быть проблематично; подумайте об использовании начальной загрузки для построения доверительного интервала вокруг минимума (или максимума).
Но, возможно, этот подход имеет недостатки? Пожалуйста, дайте мне знать.
РЕДАКТИРОВАТЬ:
Так имеет ли смысл предполагать, что 1- й процентиль выборки является предвзятой оценкой 1- го процентиля населения? И если нет, верно ли мое альтернативное решение?