Я пытаюсь решить следующий вопрос:
Игрок A выиграл 17 из 25 игр, а игрок B выиграл 8 из 20 - есть ли значительная разница между обоими соотношениями?
В R приходит на ум следующее:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Таким образом, этот тест говорит, что разница не является существенной при уровне достоверности 95%.
Поскольку мы знаем, что prop.test()
используется только приближение, я хочу сделать вещи более точными с помощью точного биномиального теста - и я делаю это обоими способами:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
Теперь это странно, не правда ли? Значения p совершенно разные каждый раз! В обоих случаях сейчас результаты (очень) значимы, но р-значения кажутся довольно случайными.
Мои вопросы
- Почему значения р , что каждый раз разный?
- Как правильно выполнить биномиальный тест с двумя пропорциями выборки в R?
prop.test
vschisq.test
), в этом вопросе используется та же основная концепция . Вы запускаете три разных теста с разными «нулевыми гипотезами» в каждом из ваших трех примеров.