Анализ мощности для биномиальных данных, когда нулевая гипотеза состоит в том, что


10

Я хотел бы провести анализ мощности для одной выборки из биномиальных данных, с , по сравнению с , где - это доля успехов в популяции. Если , я мог бы использовать либо нормальное приближение к биномиальному, либо -test, но при оба эти значения не пройдены. Я хотел бы знать, есть ли способ сделать этот анализ. Я был бы очень признателен за любые предложения, комментарии или ссылки. Большое спасибо!H 1 : p = 0,001 p 0 < p < 1 χ 2 p = 0H0:p=0H1:p=0.001p0<p<1χ2p=0


Так почему же вы не используете точный тест Клоппера-Пирсона?
Стефан Лоран

2
Я надеюсь, что у вас действительно большой образец! Это будет трудно проверить.
Питер Флом

Ответы:


13

У вас есть односторонняя, точная альтернативная гипотеза где и . p 1 = 0,001 p 0 = 0p1>p0p1=0.001p0=0

  • Первым шагом является определение порога для количества успехов, так что вероятность получить по меньшей мере успехов в выборке размера очень мала при нулевой гипотезе (условно ). В вашем случае , независимо от вашего конкретного выбора для и .ccnα=0.05c=1n1α>0
  • Второй шаг - выяснить вероятность получения не менее успехов в выборке размера согласно альтернативной гипотезе - это ваша сила. Здесь вам нужно фиксированное такое, чтобы биномиальное распределение полностью указано.cnnB(n,p1)

Второй шаг в R с :n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Чтобы понять, как мощность изменяется в зависимости от размера выборки, вы можете нарисовать функцию мощности: введите описание изображения здесь

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

Если вы хотите узнать, какой размер выборки необходим для достижения хотя бы предварительно определенной мощности, вы можете использовать значения мощности, рассчитанные выше. Скажем, вы хотите мощность не менее .0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

Таким образом, вам нужен размер выборки не менее чтобы получить мощность .6930.5


Согласно данным pwr.p.test, для степени 0,5 вам нужно как минимум 677 наблюдений. Но мощность = 0,5 очень низкая!
Джессика

@caracal Используете ли вы нормальное приближение, чтобы получить кривую мощности? Точная биноминальная степенная функция не была бы такой гладкой. Это на самом деле пилообразная, которую можно увидеть, если увеличить ось размера образца. Я обсуждаю это в своей статье 2002 года, опубликованной американским статистиком в соавторстве с Кристиной Лю. Кроме того, бином настолько искажен при очень низком p, что n должно быть большим, чтобы нормальное приближение работало хорошо.
Майкл Р. Черник

2
@MichaelChernick Нет, это из биномиальных распределений, а не из нормального приближения. Конечно, вы правы в том, что - в целом - мощность для биномиального теста является пилообразной функцией, которая не является монотонной. Но обратите внимание, что у нас есть особый случай с . Это означает, что область принятия альтернативной гипотезы всегда начинается с 1, независимо от . С постоянным порогом , константой мощность является строго возрастающей функцией . n c = 1 p 1 = 0,001 np0=0nc=1p1=0.001n
Каракал

@Jessica Обратите внимание, что pwr.p.test()используется нормальное приближение, а не точное биномиальное распределение. Просто введите, pwr.p.testчтобы взглянуть на исходный код. Вы найдете звонки, pnorm()указывающие, что используется приближение.
Каракал

1
@caracal Итак, я могу взглянуть на это так: при нулевой гипотезе вероятность успеха равна 0, поэтому, если вы когда-нибудь увидите успех, вы можете отклонить нулевую гипотезу. Вот почему вы говорите, что порог равен 1, потому что если биноминальная сумма когда-либо достигает 1, вы можете отклонить с ошибкой типа 2, равной 0! Теперь при альтернативе вероятность первого успеха в n-м испытании равна (1-p) p. Эта вероятность стремится к 0, а n стремится к бесконечности. Таким образом, последовательное правило, идущее по стопу, когда S = 1, будет иметь степень 1 для любого p> 0. - 1 nn1n
Майкл Р. Черник

3

Вы можете легко ответить на этот вопрос с pwrпакетом в R.

Вам нужно будет определить уровень значимости, мощность и величину эффекта. Как правило, уровень значимости устанавливается на 0,05, а мощность - на 0,8. Более высокая мощность потребует больше наблюдений. Более низкий уровень значимости уменьшит силу.

Размер эффекта для пропорций, используемых в этом пакете, равен h Коэна. Отсечка для малого h часто принимается равной 0,20. Фактическое ограничение зависит от приложения и может быть меньше в вашем случае. Меньше h означает, что потребуется больше наблюдений. Вы сказали, что ваш вариант . Это очень малоp=0.001

> ES.h(.001, 0)
[1] 0.0632561

Но мы все еще можем продолжить.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Используя эти значения, вам нужно как минимум 1546 наблюдений.


1

В вашем конкретном случае есть простое точное решение:

Согласно определенной нулевой гипотезе вы никогда не должны наблюдать успех. Так что, как только вы заметите один успех, вы можете быть уверены, что .p 0H0:p=0p0

Согласно альтернативе Количество испытаний, необходимых для наблюдения как минимум 1 успеха, следует геометрическому распределению. Таким образом, чтобы получить минимальный размер выборки для достижения степени , вам нужно найти наименьшее k, такое что1 - β 1 - β 1 - ( 1 - p ) ( k - 1 )H1:p=0.0011β

1β1(1p)(k1)

Таким образом, при для получения мощности вам потребуется как минимум 1610 выборок.80p=0.00180


Прочитав комментарии к решению 1, я понимаю, что это по сути то же самое решение, которое вы получаете, если будете придерживаться одного из них. Тем не менее, никогда не повредит изложить некоторые основные результаты теории вероятностей, не прибегая к интуиции.
плавать
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.