Требуется ли центрирование при начальной загрузке образца?

Читая о том, как приблизить распределение выборки, я наткнулся на непараметрический метод начальной загрузки. По- видимому, можно аппроксимировать распределение распределения , где обозначает образец среднего значения выборки начальной загрузки. $\bar{X}_n-\mu$ $\bar{X}_n^*-\bar{X}_n$ $\bar{X}_n^*$

Мой вопрос: мне нужно центрирование? Зачем?

Разве я не могу просто приблизить к ? $\mathbb{P}\left(\bar{X}_n \leq x\right)$ $\mathbb{P}\left(\bar{X}_n^* \leq x\right)$

— Christin
источник

Я не понимаю, зачем вам нужно что-то центрировать. Все образцы, обсуждаемые здесь, имеют одинаковый размер, верно?

— побитовый

Тот же размер, да. Я также не вижу причины для центрирования. Кто-нибудь сможет придумать математическое объяснение, почему или почему мы не должны это делать? Я имею в виду, можем ли мы доказать, что бутстрап работает или не работает, если мы не центрируемся?

— Кристин

(Между прочим, доказательство того, что бутстрап работает для случая, когда мы центрировались, можно найти в Bickel, PJ and DA Freedman (1981), Некоторая асимптотическая теория для бутстрапа .)

— Кристин

Мне любопытно: почему этот вопрос опущен?

— кардинал

n^{\frac{1}{2}} ({\bar{X}}_{n} - μ)

$n^{\frac{1}{2}}(\bar{X}_n-\mu)$

n^{\frac{1}{2}} ({\bar{X}}_{n}^{*} - {\bar{X}}_{n})

$n^{\frac{1}{2}}(\bar{X}_n^*-\bar{X}_n)$

N (0, σ^{2})

$\mathcal{N}(0,\sigma^2)$

$\mathbb{P}\left(\bar{X}_n \leq x\right)$ $\mathbb{P}\left(\bar{X}_n^* \leq x\right)$

Вариант с подходом центрирования идет следующим шагом и масштабирует вашу центрированную статистику начальной загрузки со стандартным отклонением повторной выборки и размером выборки, вычисляя так же, как и при статистике. Квантили из распределения этих t-статистики можно использовать для построения доверительного интервала или выполнения проверки гипотезы. Это метод начальной загрузки, и он дает превосходные результаты, когда делает выводы о среднем.

$s^*$

$T^*=\frac{\bar{X}_n^*-\bar{X}}{s^*/\sqrt{n}}$

$T^*$ $\mu$

$\bar{X}-T^*_{0.975} \frac{s}{\sqrt{n}}, \bar{X}-T^*_{0.025} \frac{s}{\sqrt{n}}$

Рассмотрим приведенные ниже результаты моделирования, показывающие, что при сильно искаженном смешанном распределении доверительные интервалы этого метода содержат истинное значение чаще, чем либо метод начальной загрузки процентиля, либо традиционное обращение статистики при отсутствии начальной загрузки.

compare.boots <- function(samp, reps = 599){
    # "samp" is the actual original observed sample
    # "s" is a re-sample for bootstrap purposes

    n <- length(samp)

    boot.t <- numeric(reps)
    boot.p <- numeric(reps)

    for(i in 1:reps){
        s <- sample(samp, replace=TRUE)
        boot.t[i] <- (mean(s)-mean(samp)) / (sd(s)/sqrt(n))
        boot.p[i] <- mean(s)
    }

    conf.t <- mean(samp)-quantile(boot.t, probs=c(0.975,0.025))*sd(samp)/sqrt(n)
    conf.p <- quantile(boot.p, probs=c(0.025, 0.975))

    return(rbind(conf.t, conf.p, "Trad T test"=t.test(samp)$conf.int))
}

# Tests below will be for case where sample size is 15
n <- 15

# Create a population that is normally distributed
set.seed(123)
pop <- rnorm(1000,10,1)
my.sample <- sample(pop,n)
# All three methods have similar results when normally distributed
compare.boots(my.sample)

Это дает следующее (conf.t - метод начальной загрузки t; conf.p - метод начальной загрузки).

          97.5%     2.5%
conf.t      9.648824 10.98006
conf.p      9.808311 10.95964
Trad T test 9.681865 11.01644

С одним примером из перекошенного дистрибутива:

# create a population that is a mixture of two normal and one gamma distribution
set.seed(123)
pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
my.sample <- sample(pop,n)
mean(pop)
compare.boots(my.sample)

Это дает следующее. Обратите внимание, что "conf.t" - версия начальной загрузки t - дает более широкий доверительный интервал, чем две другие. В основном, лучше реагировать на необычное распределение населения.

> mean(pop)
[1] 13.02341
> compare.boots(my.sample)
                97.5%     2.5%
conf.t      10.432285 29.54331
conf.p       9.813542 19.67761
Trad T test  8.312949 20.24093

Наконец, вот тысяча симуляций, чтобы увидеть, какая версия дает доверительные интервалы, которые чаще всего являются правильными:

# simulation study
set.seed(123)
sims <- 1000
results <- matrix(FALSE, sims,3)
colnames(results) <- c("Bootstrap T", "Bootstrap percentile", "Trad T test")

for(i in 1:sims){
    pop <- c(rnorm(1000,10,2),rgamma(3000,3,1)*4, rnorm(200,45,7))
    my.sample <- sample(pop,n)
    mu <- mean(pop)
    x <- compare.boots(my.sample)
    for(j in 1:3){
        results[i,j] <- x[j,1] < mu & x[j,2] > mu
    }
}

apply(results,2,sum)

Это дает результаты ниже - числа из 1000 раз, когда доверительный интервал содержит истинное значение моделируемой совокупности. Обратите внимание, что истинный показатель успеха каждой версии значительно меньше 95%.

     Bootstrap T Bootstrap percentile          Trad T test 
             901                  854                  890

— Питер Эллис
источник

Спасибо, это было очень информативно. Этот .pdf (из урока) описывает предостережение к вашему выводу: psychology.mcmaster.ca/bennett/boot09/percentileT.pdf Это краткое изложение того, что говорит Беннет: Многие наборы данных состоят из чисел, которые> = 0 (то есть данные это может быть подсчитано), в этом случае CI не должен содержать отрицательных значений. С помощью метода bootstrap-t это может произойти, делая доверительный интервал неправдоподобным. Требование, чтобы данные были> = 0, нарушает предположение нормального распределения. Это не проблема при создании процентильного загрузочного CI

— Ханнес Циглер