Вычисление стандартной ошибки в средневзвешенной оценке


16

Предположим , что w1,w2,,wn и каждый обращается н.о.р. из некоторых распределений с независимо от . В строго положительны. Вы наблюдаете все , но не ; скорее вы наблюдаете . Я заинтересован в оценке из этой информации. Очевидно, что оценщик является беспристрастным и может быть вычислен с учетом имеющейся информации.x1,x2,...,xnwixiwiwixiixiwiE[x]

x¯=iwixiiwi

Как я могу вычислить стандартную ошибку этого оценщика? Для где принимает только значения 0 и 1, я наивно пытался выполнить основном игнорируя изменчивость в , но обнаружил, что это плохо работает для размеров выборки меньше, чем около 250. (И это, вероятно, зависит от дисперсии .) Кажется, что, возможно, у меня недостаточно информации, чтобы вычислить «лучшую» стандартную ошибку.xiшIшI

sex¯(1x¯)iwi2iwi,
wiwi

Ответы:


17

Я столкнулся с той же проблемой недавно. Вот что я нашел:

В отличие от простой случайной выборки с равными весами, нет общепринятого определения стандартной ошибки взвешенного среднего. В наши дни было бы просто сделать начальную загрузку и получить эмпирическое распределение среднего значения, и исходя из этой оценки стандартная ошибка.

Что если кто-то хочет использовать формулу для этой оценки?

Основная ссылка - это работа Дональда Ф. Гатца и Лютера Смита, где 3 оценки на основе формул сравниваются с результатами начальной загрузки. Наилучшее приближение к результату начальной загрузки получено из Кокрана (1977):

(SEMw)2=n(n1)(Pi)2[(PiXiP¯X¯w)22X¯w(PiP¯)(PiXiP¯X¯w)+X¯w2(PiP¯)2]

Ниже приведен соответствующий код R, полученный из этого потока R listserve .

weighted.var.se <- function(x, w, na.rm=FALSE)
#  Computes the variance of a weighted mean following Cochran 1977 definition
{
  if (na.rm) { w <- w[i <- !is.na(x)]; x <- x[i] }
  n = length(w)
  xWbar = weighted.mean(x,w,na.rm=na.rm)
  wbar = mean(w)
  out = n/((n-1)*sum(w)^2)*(sum((w*x-wbar*xWbar)^2)-2*xWbar*sum((w-wbar)*(w*x-wbar*xWbar))+xWbar^2*sum((w-wbar)^2))
  return(out)
}

Надеюсь это поможет!


Это довольно круто, но для моей проблемы я даже не наблюдаю , скорее, я наблюдаю сумму i P i X i . Мой вопрос очень странный, потому что он связан с некоторой информационной асимметрией (третья сторона сообщает о сумме и пытается скрыть некоторую информацию). PiXiiPiXi
Шаббычеф

Черт возьми, извини, я не до конца понял вопрос, который ты поставил. Предположу , мы кипятим вашу проблему вплоть до простейшего случая , когда все являюсь Бернулли RV. Тогда вы по существу наблюдаете сумму случайного подмножества n RV. Я думаю, что здесь не так много информации для оценки. Итак, что вы в итоге сделали для своей первоначальной проблемы? win
Ming K

@ Ming-ChihKao эта формула Кохрана интересна, но если вы построите доверительный интервал из этого, когда данные не являются нормальными, нет ли правильной последовательной интерпретации? Как бы вы справились с ненормальными средневзвешенными доверительными интервалами? Взвешенные квантили?
user3022875

Я думаю, что есть ошибка с функцией. Если вы замените w=rep(1, length(x)), то weighted.var.se(rnorm(50), rep(1, 50))о 0.014. Я думаю, что формула отсутствует sum(w^2)в числителе, так как, когда P=1дисперсия 1/(n*(n-1)) * sum((x-xbar)^2). Я не могу проверить процитированную статью, поскольку она находится за платным доступом, но я думаю, что это исправление. Как ни странно, решение Википедии (другое) становится вырожденным, когда все веса равны: en.wikipedia.org/wiki/… .
Макс Кандокия

Они могут работать лучше вообще: analyticalgroup.com/download/WEIGHTED_MEAN.pdf
Макс Candocia

5

Дисперсия вашей оценки с учетом равна w 2 i V a r ( X )wi Поскольку ваша оценка несмещена для любогоwi, дисперсия ее условного среднего равна нулю. Следовательно, дисперсия вашей оценки Var(X)E( w 2 i

wi2Var(X)(wi)2=Var(X)wi2(wi)2.
wi Со всеми наблюдаемыми данными это было бы легко оценить эмпирически. Но, учитывая только меру местоположениянаблюдаемогоXi, а не их распространение, я не понимаю, как можно будет получить оценкуVar(X), не делая довольно серьезных предположений.
Var(X)E(wi2(wi)2)
XiVar(X)

xixx¯(1x¯)
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.