Связь между тестом Макнемара и условной логистической регрессией

14

Я заинтересован в моделировании данных бинарных ответов в парных наблюдениях. Мы стремимся сделать вывод об эффективности предварительного вмешательства в группе, потенциально адаптируясь к нескольким ковариатам и определяя, есть ли изменение эффекта в группе, которая получила особенно различную подготовку в рамках вмешательства.

Приведены данные следующего вида:

id phase resp
1  pre   1
1  post  0
2  pre   0
2  post  0
3  pre   1
3  post  0

И таблица сопряженности сопряженной информации ответа: $2 \times 2$

\begin{array}{cccc} до \\ Верный & некорректный \\ Почта & Верный & a & б \\ некорректный & с & d \end{array}

$\begin{array}{cc|cc} & & \mbox{Pre} & \\ & & \mbox{Correct} & \mbox{Incorrect} \\ \hline \mbox{Post} & \mbox{Correct} & a & b&\\ & \mbox{Incorrect} & c& d&\\ \end{array}$

Нас интересует проверка гипотезы: . $\mathcal{H}_0: \theta_c = 1$

Тест Макнемара дает: при (асимптотически). Это интуитивно понятно, поскольку при нулевом значении мы ожидаем, что равная доля дискордантных пар ( и ) будет благоприятствовать положительному эффекту ( ) или отрицательному эффекту ( ). С вероятностью положительного определения случая определены и . Вероятность наблюдения положительной дискордантной пары равна . $Q = \frac{(b-c)^2}{b+c} \sim \chi^2_1$ $\mathcal{H}_0$ $b$ $c$ $b$ $c$ $p =\frac{b}{b+c}$ $n=b+c$ $\frac{p}{1-p}=\frac{b}{c}$

С другой стороны, условная логистическая регрессия использует другой подход для проверки той же гипотезы, максимизируя условную вероятность:

L (Икс; β) знак равно Π_{J знак равно 1}^{N} \frac{ехр (β {Икс}_{J, 2})}{ехр (β {Икс}_{J, 1}) + ехр (β {Икс}_{J, 2})}

$\mathcal{L}(X ; \beta) = \prod_{j=1}^n \frac{\exp(\beta X_{j,2})}{\exp(\beta X_{j,1}) + \exp(\beta X_{j,2})}$

где . $\exp(\beta) = \theta_c$

Итак, какова связь между этими тестами? Как можно провести простую проверку таблицы сопряженности, представленной ранее? Глядя на калибровку значений p из подходов Клогита и Макнемара под нулевым значением, можно подумать, что они совершенно не связаны!

library(survival)
n <- 100
do.one <- function(n) {
  id <- rep(1:n, each=2)
  ph <- rep(0:1, times=n)
  rs <- rbinom(n*2, 1, 0.5)
  c(
    'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
    'pmctest' = mcnemar.test(table(ph,rs))$p.value
  )
}

out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests', 
  xlab='p-value McNemar', ylab='p-value conditional logistic regression')

введите описание изображения здесь

logistic mcnemar-test clogit

— Adamo
источник

Это интересно! Два метода должны иметь сходные результаты в соответствии с теорией. Если я правильно понимаю вопрос, нулевая гипотеза теста - это , а нулевая гипотеза теста условной логистической регрессии - отношение шансов в страте.

p_{b} = p_{c}

$p_b=p_c$

a d / b c = 1

$ad/bc=1$

— Рандель

Кажется, я вспоминаю, что можно параметризировать тест Макнемара как тест отношения шансов, поэтому мне интересно, как можно выписать вероятность (условную вероятность?) Для этого теста.

— AdamO

Я не уверен, что вы имеете в виду точную версию теста Макнемара. Бреслоу и Дэй (1980) , с. 164-166 и упаковка exact2x2 могут быть ссылками.

— Рандел

4

Извините, это старая проблема, я с этим столкнулся случайно.

В вашем коде есть ошибка для теста mcnemar. Попробуйте с:

n <- 100
do.one <- function(n) {
  id <- rep(1:n, each=2)
  case <- rep(0:1, times=n)
  rs <- rbinom(n*2, 1, 0.5)
  c(
    'pclogit' = coef(summary(clogit(case ~ rs + strata(id))))[5],
    'pmctest' = mcnemar.test(table(rs[case == 0], rs[case == 1]))$p.value
  )
}

out <- replicate(1000, do.one(n))

введите описание изображения здесь

— eusebe
источник

Вот это да! Спасибо и добро пожаловать в сообщество. Просто чтобы уточнить, МакНемар работает над несоответствующими согласованными парами (?), Выпадают ли такие пары из клогита? Я не вижу, как id участвует в вычислении результатов mcnemar. Возможно, установление корреляции в них поможет выяснить, что делает клогит.

— AdamO

2

Есть 2 конкурирующих статистических модели. Модель № 1 (нулевая гипотеза, Макнемар): вероятность от правильного до неправильного = вероятность от неправильного до правильного = 0,5 или эквивалентного b = c. Модель № 2: вероятность от правильного к неправильному <вероятность неправильного к правильному или эквивалентному b> c. Для модели № 2 мы используем метод максимального правдоподобия и логистическую регрессию для определения параметров модели, представляющих модель 2. Статистические методы выглядят по-разному, потому что каждый метод отражает свою модель.

— AMM
источник

Вы говорите, что клогит не является двусторонним тестом?

— AdamO