Тест Барнарда используется, когда параметр неприятности неизвестен по нулевой гипотезе.
Однако в дегустационном тесте для леди вы можете утверждать, что в соответствии с нулевой гипотезой параметр неприятности может быть установлен равным 0,5 (у неинформированной женщины есть 50% вероятности правильно угадать чашку).
Тогда число правильных догадок, согласно нулевой гипотезе, становится биномиальным распределением: угадывание 8 чашек с вероятностью 50% для каждой чашки.
В других случаях у вас может не быть этой тривиальной вероятности 50% для нулевой гипотезы. А без фиксированных полей вы можете не знать, какой должна быть эта вероятность. В этом случае вам нужен тест Барнарда.
Даже если вы проведете тест Барнарда на дегустации чая для женщин, он все равно станет равным 50% (если все результаты будут правильными), поскольку параметр неприятности с наибольшим значением p равен 0,5 и приведет к тривиальному биномиальному тесту ( на самом деле это комбинация двух биномиальных тестов (один для четырех первых чашек молока и один для четырех первых чашек чая).
> library(Barnard)
> barnard.test(4,0,0,4)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 0
Outcome II 0 4
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -2.82843
Nuisance parameter = 0.5 (One sided), 0.5 (Two sided)
P-value = 0.00390625 (One sided), 0.0078125 (Two sided)
> dbinom(8,8,0.5)
[1] 0.00390625
> dbinom(4,4,0.5)^2
[1] 0.00390625
Ниже приведено описание более сложного результата (если не все догадки верны, например, 2 против 4), тогда подсчет того, что является, а что нет, становится немного сложнее.
(Также обратите внимание, что тест Барнарда использует, в случае результата 4-2, параметр неудобства p = 0,686, который, как вы могли бы утверждать, является неправильным, значение p для 50% вероятности ответа «сначала чай» будет 0.08203125. Это становится еще меньше, когда вы рассматриваете другой регион, а не тот, который основан на статистике Вальда, хотя определить регион не так просто )
out <- rep(0,1000)
for (k in 1:1000) {
p <- k/1000
ps <- matrix(rep(0,25),5) # probability for outcome i,j
ts <- matrix(rep(0,25),5) # distance of outcome i,j (using wald statistic)
for (i in 0:4) {
for (j in 0:4) {
ps[i+1,j+1] <- dbinom(i,4,p)*dbinom(j,4,p)
pt <- (i+j)/8
p1 <- i/4
p2 <- j/4
ts[i+1,j+1] <- (p2-p1)/sqrt(pt*(1-pt)*(0.25+0.25))
}
}
cases <- ts < ts[2+1,4+1]
cases[1,1] = TRUE
cases[5,5] = TRUE
ps
out[k] <- 1-sum(ps[cases])
}
> max(out)
[1] 0.08926748
> barnard.test(4,2,0,2)
Barnard's Unconditional Test
Treatment I Treatment II
Outcome I 4 2
Outcome II 0 2
Null hypothesis: Treatments have no effect on the outcomes
Score statistic = -1.63299
Nuisance parameter = 0.686 (One sided), 0.314 (Two sided)
P-value = 0.0892675 (One sided), 0.178535 (Two sided)