Обратите внимание, что выражение дисперсии в вопросе является приближенным. Хеджес (1981) вывел большую выборочную дисперсию и аппроксимации в общей обстановке (т. Е. Множественные эксперименты / исследования), и мой ответ в значительной степени идет по выводам в статье.d
Во-первых, мы будем использовать следующие предположения:
Давайте предположим, что у нас есть две независимые группы лечения, (лечение) и (контроль). Пусть и будут баллами / ответами / кем бы то ни было от субъекта в группе и субъекта в группе соответственно.C Y T i Y C j i T j CTСYTяYCjiTjC
Мы предполагаем, что ответы обычно распределены, а группы лечения и контроля имеют общую разницу, т.е.
YTiYCj∼N(μT,σ2),i=1,…nT∼N(μC,σ2),j=1,…nC
Размер эффекта, который мы хотим оценить в каждом исследовании, равен . Оценка размера эффекта, который мы будем использовать:
где - несмещенная выборочная дисперсия для группы . д= ˉ Y T- ˉ Y Cδ=μT−μCσ S2kk
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√
S2kk
Давайте рассмотрим свойства большой выборки . d
Во-первых, обратите внимание:
и (не совпадают с моими обозначениями):
и
Y¯T−Y¯C∼N(μT−μC,σ2nT+nCnTnC)
(nT−1)S2Tσ2(nT+nC−2)=1nT+nC−2(nT−1)S2Tσ2∼1nT+nC−2χ2nT−1(1)
(nC−1)S2Cσ2(nT+nC−2)=1nT+nC−2(nC−1)S2Cσ2∼1nT+nC−2χ2nC−1(2)
Уравнения (1) и (2) приводят к тому, что (опять же, с моими обозначениями):
1σ2(nT−1)S2T+(nC−1)S2CnT+nC−2∼1nT+nC−2χ2nT+nC−2
Теперь немного умной алгебры:
где
d=Y¯T−Y¯C(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(σnT+nCnTnC−−−−−√)−1(Y¯T−Y¯C)(σnT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2CnT+nC−2−−−−−−−−−−−−−√=(Y¯T−Y¯C)−(μT−μC)σnT+nCnTnC√+μT−μCσnT+nCnTnC√(nT+nCnTnC−−−−−√)−1(nT−1)S2T+(nC−1)S2Cσ2(nT+nC−2)−−−−−−−−−−−−−√=nT+nCnTnC−−−−−−−√⎛⎝⎜θ+δnTnCnT+nC−−−−−√Vν−−√⎞⎠⎟
θ∼N(0,1), и . Таким образом, равно раз переменной, которая следует за нецентральным t-распределением с степенями свободы и параметром нецентральности .
V∼χ2νν=nT+nC−2dnT+nCnTnC−−−−−√nT+nC−2δnTnCnT+nC−−−−−√
Используя моментные свойства нецентрального распределенияt , следует:
где
Var(d)=(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2b2(3)
b=Γ(nT+nC−22)nT+nC−22−−−−−−−√Γ(nT+nC−32)≈1−34(nT+nC−2)−1
Таким образом, уравнение (3) обеспечивает точную дисперсию большой выборки. Обратите внимание, что несмещенной оценкой для является с дисперсией:δbd
Var(bd)=b2(nT+nC−2)(nT+nC−4)(nT+nC)nTnC(1+δ2nTnCnT+nC)−δ2
Для больших степеней свободы (т.е. больших ) дисперсия нецентрального изменяющегося с степенями свободы и параметром нецентральности может быть аппроксимирована как ( Джонсон, Коц, Балакришнан, 1995 ). Таким образом, мы имеем:
nT+nC−2tνp1+p22ν
Var(d)≈nT+nCnTnC⎛⎝⎜1+δ2(nTnCnT+nC)2(nT+nC−2)⎞⎠⎟=nT+nCnTnC+δ22(nT+nC−2)
Подключите наш оценщик для и все готово.δ