Найти силу против экспоненциальных альтернатив со сдвигом масштаба достаточно просто.
Тем не менее, я не знаю , что вы должны использовать значение , вычисленное из данных , чтобы выяснить , что власть может быть. Такого рода вычисления мощности по принципу hoc имеют тенденцию приводить к нелогичным (и, возможно, вводящим в заблуждение) выводам.
Власть, как и уровень значимости, - это феномен, с которым вы сталкиваетесь до факта; вы бы использовали априорное понимание (включая теорию, рассуждения или любые предыдущие исследования), чтобы принять решение о разумном наборе альтернатив для рассмотрения и желаемом размере эффекта
Вы также можете рассмотреть множество других альтернатив (например, вы можете встроить экспоненту в гамма-семью, чтобы учесть влияние более или менее искаженных случаев).
Обычные вопросы, на которые можно попытаться ответить с помощью силового анализа:
1) какова мощность для данного размера выборки при некотором размере эффекта или наборе размеров эффекта *?
2) насколько велик эффект, определяемый размером выборки и мощностью?
3) Какой размер выборки необходим при желаемой мощности для определенного размера эффекта?
* (где здесь «величина эффекта» подразумевается в общем и может быть, например, конкретным соотношением средств или разностью средств, не обязательно стандартизированным).
Очевидно, у вас уже есть размер выборки, так что вы не в случае (3). Вы могли бы разумно рассмотреть вариант (2) или вариант (1).
Я бы предложил вариант (1) (который также дает возможность разобраться с вариантом (2)).
Чтобы проиллюстрировать подход к случаю (1) и увидеть, как он относится к случаю (2), давайте рассмотрим конкретный пример с:
альтернативы масштабного сдвига
экспоненциальные популяции
размеры выборки в двух выборках по 64 и 54
Поскольку размеры выборки различны, мы должны рассмотреть случай, когда относительный разброс в одной из выборок меньше и больше 1 (если они были одинакового размера, соображения симметрии позволяют рассмотреть только одну сторону). Однако, поскольку они довольно близки к одинаковому размеру, эффект очень мал. В любом случае исправьте параметр для одного из образцов и измените другой.
Итак, что вы делаете:
Заблаговременно:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
Чтобы сделать расчеты:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
В R я сделал это:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
который дает следующую степень "кривой"
Ось X находится в логарифмическом масштабе, ось Y - коэффициент отклонения.
Трудно сказать здесь, но черные точки немного выше слева, чем справа (то есть, мощность немного больше, когда больший образец имеет меньший масштаб).
Используя обратный нормальный cdf в качестве преобразования коэффициента отклонения, мы можем сделать соотношение между преобразованным коэффициентом отклонения и логарифмом каппа (каппа находится s
на графике, но ось x логарифмирована) очень почти линейно (за исключением около 0 ), и количество симуляций было достаточно высоким, чтобы шум был очень низким - мы можем просто проигнорировать его для настоящих целей.
Таким образом, мы можем просто использовать линейную интерполяцию. Ниже показаны приблизительные размеры эффекта для мощности 50% и 80% при ваших размерах выборки:
Размеры эффекта на другой стороне (большая группа имеет меньший масштаб) лишь незначительно смещены от этого (может получить немного меньший размер эффекта), но это не имеет большого значения, поэтому я не буду разбираться с этим вопросом.
Таким образом, тест подберет существенную разницу (из соотношения шкал 1), но не небольшую.
Теперь о некоторых комментариях: я не думаю, что проверки гипотез особенно важны для основного вопроса, представляющего интерес ( действительно ли они похожи? ), И, следовательно, эти вычисления мощности не говорят нам ничего, что имеет непосредственное отношение к этому вопросу.
Я думаю, что вы решаете этот более полезный вопрос, заранее указав, что, по вашему мнению, «по сути, то же самое» означает на практике. Это - рационально направленное на статистическую деятельность - должно привести к содержательному анализу данных.