Что означает доверительный интервал, взятый из повторных выборок при загрузке?

Я просматривал многочисленные вопросы на этом сайте, касающиеся начальной загрузки и доверительных интервалов, но я все еще в замешательстве. Одна из причин моего замешательства, вероятно, заключается в том, что я недостаточно продвинут в своих знаниях статистики, чтобы понять многие ответы. Я на полпути к вводному курсу статистики, и мой математический уровень только около середины алгебры II, так что все, что превышает этот уровень, просто смущает меня. Если бы один из знающих людей на этом сайте мог бы объяснить эту проблему на моем уровне, это было бы чрезвычайно полезно.

Мы учились в классе, как брать повторные выборки с помощью метода начальной загрузки и использовать их для построения доверительного интервала для некоторой статистики, которую мы хотели бы измерить. Например, предположим, что мы берем выборку из большой совокупности и находим, что 40% говорят, что проголосуют за кандидата А. Мы предполагаем, что эта выборка является довольно точным отражением исходной совокупности, и в этом случае мы можем взять повторные выборки из это узнать что-то о населении. Таким образом, мы берем повторные выборки и находим (используя уровень достоверности 95%), что полученный доверительный интервал составляет от 35% до 45%.

Мой вопрос: что на самом деле означает этот доверительный интервал ?

Я продолжаю читать, что есть разница между (частыми) доверительными интервалами и (байесовскими) доверительными интервалами. Если я правильно понял, то вероятный интервал бы сказать , что есть 95% вероятность того, что в нашей ситуации истинный параметр находится в пределах заданного интервала (35% -45%), в то время как доверительный интервал будет сказать , что есть 95% , что в этом тип ситуации (но не обязательно в нашей конкретной ситуации) метод, который мы используем, будет точно сообщать, что истинный параметр находится в заданном интервале.

Предполагая, что это определение верно, мой вопрос: о каком «истинном параметре» мы говорим, когда используем доверительные интервалы, построенные с помощью метода начальной загрузки? Имеем ли мы в виду (а) истинный параметр исходного населения или (б) истинный параметр выборки ? Если (а), то мы бы сказали, что в 95% случаев метод начальной загрузки будет точно сообщать истинные утверждения об исходной популяции. Но как мы могли это знать? Разве весь метод начальной загрузки не основывается на предположениичто исходный образец является точным отражением населения, из которого он был взят? Если (б), то я вообще не понимаю значения доверительного интервала. Разве мы уже не знаем истинный параметр образца? Это простое измерение!

Я обсудил это с моей учительницей, и она мне очень помогла. Но я все еще в замешательстве.

confidence-interval bootstrap

— iarwain
источник

Ответы:

Если процедура начальной загрузки и формирование доверительного интервала были выполнены правильно, это означает то же самое, что и любой другой доверительный интервал. С частой точки зрения 95% ДИ подразумевает, что, если бы все исследование повторялось одинаково до бесконечности , 95% таких доверительных интервалов, сформированных таким образом, будут включать истинное значение. Конечно, в вашем исследовании или в любом отдельном отдельном исследовании доверительный интервал будет либо включать истинное значение, либо нет, но вы не будете знать, какой именно. Чтобы лучше понять эти идеи, вам может помочь прочесть мой ответ здесь: почему 95% доверительный интервал (КИ) не подразумевает 95% вероятности удержания среднего значения?

$\bar x$ $\mu$ , Для быстрой демонстрации, если не считать математики, рассмотрим следующую симуляцию с использованием R:

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952

— Gung - Восстановить Монику
источник

На какие конкретные предположения мы опираемся?

— Ярвин

Спасибо. Я думаю, что нашел то, что искал, во втором ответе на эту тему: «Помните, что мы не используем средства выборки при начальной загрузке для оценки среднего населения, мы используем среднее значение выборки для этого (или любую статистику, представляющую интерес». is.) Но мы используем образцы начальной загрузки для оценки свойств (разброса, смещения) процесса выборки. И использование выборки из известной совокупности (которая, как мы надеемся, является репрезентативной для совокупности, представляющей интерес) для изучения эффектов выборки имеет смысл и намного менее круглым. " ...

— iarwain

... Другими словами, все, что CI говорит нам, это то, что в популяции, примерно такой же, как наша, мы ожидаем, что 95% выборок, взятых из этой популяции, будут отражать истинное значение +/- погрешность. Таким образом, все, что мы делаем, это даем очень грубую подсказку - хотя, возможно, лучшую подсказку, которую мы имеем - чтобы определить, насколько близка наша выборочная статистика к истинному параметру совокупности. Если это так, то, похоже, мы не должны слишком серьезно относиться к точным числам в КИ - они просто означают что-то вроде «выборочная статистика, вероятно, приблизительно точна, возможно, примерно до такой степени». Я правильно понял?

— Ярвин

Это по существу правильно. КИ дает нам ощущение точности нашей оценки, но мы никогда не узнаем, содержит ли наш фактический (реализованный) КИ истинное значение. Основное предположение заключается в том, что наши данные представляют интерес населения. Обратите внимание, что ни один из них не является специфическим для бутстрапированных КИ, у вас есть та же интерпретация и допущение в КИ, рассчитанном по асимптотической теории.

— gung - Восстановить Монику

Это отличное объяснение. Я бы добавил только, что «истинная ценность» иногда является артефактом дизайна исследования. При опросе политических кандидатов стратифицированные выборки дают гораздо более точные и надежные оценки, чем случайная выборка. Стоимость - это риск передискретизации не той группы по замыслу. В этом случае 95% -й ДИ центрируется на правильном значении, которое достигается путем репликации исследования до бесконечности , но это значение не является другим смыслом истинного параметра: параметра, который мы хотели оценить. Вот почему дизайн исследования и умозаключения неразрывно связаны.

— AdamO

Вы говорите, что нет нужды находить доверительный интервал при повторной выборке при загрузке. Если вы удовлетворены статистикой (среднее значение выборки или пропорция выборки), полученной из загрузочных повторных выборок, не находите какой-либо доверительный интервал и, таким образом, нет вопроса о толковании. Но если вы не удовлетворены статистикой, полученной из загруженных повторных выборок или удовлетворены, но все же хотите найти доверительный интервал, то интерпретация для такого доверительного интервала такая же, как и любой другой доверительный интервал. Это потому, что когда ваши загруженные повторные выборки точно представляют (или предполагается, что так) исходную популяцию, тогда где нужен доверительный интервал? Статистика из загруженных повторных выборок является самим исходным параметром совокупности, но если вы не рассматриваете статистику как исходный параметр совокупности, то необходимо найти доверительный интервал. Итак, все зависит от того, как вы считаете. Допустим, вы вычислили 95% доверительный интервал из загрузочных повторных выборок. Теперь интерпретация такова: «В 95% случаев этот метод начальной загрузки точно приводит к доверительному интервалу, содержащему истинный параметр совокупности».

(Это то, что я думаю. Поправьте меня, если есть какие-либо ошибки).

— Чикатла Прашант
источник

-1

Мы имеем в виду истинный параметр исходного населения. Это можно сделать, предполагая, что данные были взяты случайным образом из исходной совокупности - в этом случае существуют математические аргументы, показывающие, что процедуры начальной загрузки дадут действительный доверительный интервал, по крайней мере, так как размер набора данных становится достаточно большим ,

— Gareth
источник

Похоже, чтобы понять, почему это работает, мне нужно знать достаточно математики, чтобы следовать математическим доказательствам. Это верно?

— Ярвин

Я так думаю (я не знаком с доказательствами)

— Гарет

Интуитивно понятно, что вы можете видеть, что с увеличением размера выборки выборка начинает выглядеть очень похожей на популяцию. Например, скажем, я взял 1 миллион выборок из нормального распределения с заданным средним и дисперсией. Назовите этот образец X. Случайный образец (с заменой), взятый из X, очень похож на случайный образец, взятый из исходного распределения. Я думаю, что это основная идея, почему это работает.

— Гарет