Я пытаюсь понять расчет мощности для случая двух независимых выборочных t-тестов (не предполагая равных отклонений, поэтому я использовал Satterthwaite).
Вот диаграмма, которую я нашел, чтобы помочь понять процесс:
Итак, я предположил, что, учитывая следующее о двух популяциях и размер выборки:
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
Я мог бы вычислить критическое значение под нулем, относящееся к 0,05 вероятности верхнего хвоста:
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df) #equals 1.730018
и затем вычислите альтернативную гипотезу (которая для этого случая, которую я узнал, является «нецентральным t-распределением»). Я рассчитал бета на диаграмме выше, используя нецентральное распределение и критическое значение, найденное выше. Вот полный скрипт на R:
#under alternative
mu1<-5
mu2<-6
sd1<-3
sd2<-2
n1<-20
n2<-20
#Under null
Sp<-sqrt(((n1-1)*sd1^2+(n2-1)*sd2^2)/(n1+n2-2))
df<-(((sd1^2/n1)+(sd2^2/n2)^2)^2) / ( ((sd1^2/n1)^2)/(n1-1) + ((sd2^2/n2)^2)/(n2-1) )
CV<- qt(0.95,df)
#under alternative
diff<-mu1-mu2
t<-(diff)/sqrt((sd1^2/n1)+ (sd2^2/n2))
ncp<-(diff/sqrt((sd1^2/n1)+(sd2^2/n2)))
#power
1-pt(t, df, ncp)
Это дает значение мощности 0,4935132.
Это правильный подход? Я обнаружил, что если я использую другое программное обеспечение для расчета мощности (например, SAS, которое, как мне кажется, я настроил в соответствии со своей задачей ниже), я получу другой ответ (для SAS это 0,33).
SAS-код:
proc power;
twosamplemeans test=diff_satt
meandiff = 1
groupstddevs = 3 | 2
groupweights = (1 1)
ntotal = 40
power = .
sides=1;
run;
В конечном счете, я хотел бы получить понимание, которое позволило бы мне взглянуть на симуляции для более сложных процедур.
РЕДАКТИРОВАТЬ: Я нашел свою ошибку. должны были быть
1-pt (CV, df, ncp) НЕ 1-pt (t, df, ncp)