Я заинтересован в моделировании данных бинарных ответов в парных наблюдениях. Мы стремимся сделать вывод об эффективности предварительного вмешательства в группе, потенциально адаптируясь к нескольким ковариатам и определяя, есть ли изменение эффекта в группе, которая получила особенно различную подготовку в рамках вмешательства.
Приведены данные следующего вида:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
И таблица сопряженности сопряженной информации ответа:
Нас интересует проверка гипотезы: .
Тест Макнемара дает: при (асимптотически). Это интуитивно понятно, поскольку при нулевом значении мы ожидаем, что равная доля дискордантных пар ( и ) будет благоприятствовать положительному эффекту ( ) или отрицательному эффекту ( ). С вероятностью положительного определения случая определены и . Вероятность наблюдения положительной дискордантной пары равна . H0bcbcp=b n=b+cp
С другой стороны, условная логистическая регрессия использует другой подход для проверки той же гипотезы, максимизируя условную вероятность:
где .
Итак, какова связь между этими тестами? Как можно провести простую проверку таблицы сопряженности, представленной ранее? Глядя на калибровку значений p из подходов Клогита и Макнемара под нулевым значением, можно подумать, что они совершенно не связаны!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
exact2x2
могут быть ссылками.