В чем разница между тестом Макнемара и тестом хи-квадрат, и как вы знаете, когда их использовать?


30

Я пытался читать из разных источников, но мне все еще не ясно, какой тест будет уместным в моем случае. Есть три разных вопроса о моем наборе данных:

  1. Испытуемые проверяются на инфекции от X в разное время. Я хочу знать, связана ли доля положительного для X после доли с положительным для X до:

                 After   
               |no  |yes|
    Before|No  |1157|35 |
          |Yes |220 |13 |
    
    results of chi-squared test: 
    Chi^2 =  4.183     d.f. =  1     p =  0.04082 
    
    results of McNemar's test: 
    Chi^2 =  134.2     d.f. =  1     p =  4.901e-31
    

    Насколько я понимаю, поскольку данные представляют собой повторные измерения, я должен использовать критерий Макнемара, который проверяет, изменилась ли доля положительных значений для X.

    Но мои вопросы, похоже, нуждаются в тесте хи-квадрат - тестировании, если доля положительного по X после связана с долей положительного по X до.

    Я даже не уверен, правильно ли я понимаю разницу между тестом Макнемара и хи-квадратом. Каков был бы правильный тест, если бы мой вопрос был: «Соотношение субъектов, зараженных Х, отличается от того, что было раньше?»

  2. Аналогичный случай, но вместо измерения до и после я измеряю две разные инфекции в один момент времени:

            Y   
          |no  |yes|
    X|No  |1157|35 |
     |Yes |220 |13 |
    

    Какой тест был бы здесь, если бы вопрос «Связаны ли более высокие пропорции одной инфекции с более высокими пропорциями Y»?

  3. Если бы мой вопрос был «Связана ли инфекция Y в момент t2 с инфекцией X в момент t1?», Какой тест подойдет?

                  Y at t2   
                |no  |yes|
    X at t1|No  |1157|35 |
           |Yes |220 |13 |
    

Я использовал тест Макнемара во всех этих случаях, но я сомневаюсь, что это правильный тест для ответа на мои вопросы. Я использую R. Могу ли я использовать бином glm? Будет ли это аналогично критерию хи-квадрат?


1
Вы пытались прочитать stats.stackexchange.com/questions/tagged/mcnemar-test темы здесь, в тесте Макнемара?
ttnphns

Что вы подразумеваете под «отношением между двумя вероятностями»?
Майкл М

@ttnphns Я прошел через них, но не смог переформулировать это к моему вопросу. После долгих размышлений кажется, что я могу ответить на два вопроса, основанных на Q1: Chi-sq сказал бы мне, если пропорция + ve X после соотносится с пропорцией + ve X прежде, в то время как Mcnemar's скажет мне, было ли изменить пропорции. Я прав?
Анто

Вы не можете использовать стандартный тест независимости здесь, потому что каждый человек представлен двумя значениями, вызывающими неслучайные выборки. χ2
Майкл М

Спасибо @MichaelMayer. Я использовал Макнемар, пока не увидел это . Там, где объясняется Макнемар, он говорит, что ответивший хи-кв ответит в том же случае. Я довольно озадачен. То, как говорят нам все тесты, приведено на этой странице, я должен пойти на хи-кв, но, поскольку они являются измерениями по одному и тому же предмету, я должен выбрать метод Макнемара!
Анто

Ответы:


48

Очень жаль, что тест МакНемара так труден для понимания людьми. Я даже замечаю, что в верхней части страницы в Википедии говорится, что людям сложно понять объяснение на этой странице. Типичное краткое объяснение критерия Макнемара: либо «критерий хи-квадрат» внутри субъекта, либо «критерий предельной однородности таблицы сопряженности». Я не нахожу ничего из этого очень полезным. Во-первых, неясно, что подразумевается под «хи-квадрат» внутри субъекта, потому что вы всегда измеряете свои предметы дважды (один раз для каждой переменной) и пытаетесь определить взаимосвязь между этими переменными. Кроме того, «предельная однородность» (К сожалению, даже этот ответ может сбивать с толку. Если это так, это может помочь прочитать мою вторую попытку ниже.)

Давайте посмотрим, сможем ли мы проработать процесс рассуждения о вашем лучшем примере, чтобы увидеть, можем ли мы понять, подходит ли (и если да, то почему) тест Макнемара. Вы положили:

введите описание изображения здесь

Это таблица непредвиденных обстоятельств, поэтому она содержит анализ хи-квадрат. Более того, вы хотите понять взаимосвязь между и , и тест хи-квадрат проверяет связь между переменными, поэтому на первый взгляд кажется, что тест хи-квадрат должен быть анализ, который отвечает на ваш вопрос. е т е рBeforeAfter

Однако стоит отметить, что мы также можем представить эти данные так:

введите описание изображения здесь

Когда вы смотрите на данные таким образом, вы можете подумать, что можете провести обычный старый тест. Но тест не совсем правильно. Есть две проблемы: во-первых, поскольку в каждой строке перечислены данные, измеренные по одному и тому же предмету, мы не хотели бы проводить тест между субъектами , мы хотели бы проводить тест внутри субъектов . Во-вторых, поскольку эти данные распределены в виде бинома , дисперсия является функцией среднего значения. Это означает, что нет никакой дополнительной неопределенности, о которой следует беспокоиться после оценки среднего значения выборки (т. Е. Вам не нужно впоследствии оценивать дисперсию), поэтому вам не нужно ссылаться на распределение, вы можете использоватьtт т т з з х 2 зttttzраспределение. (Более подробно об этом, это может помочь , чтобы прочитать мой ответ здесь: -test по сравнению с теста .) Таким образом, нам потребуется в-субъекты -test. То есть нам нужен внутри-предметный тест на равенство пропорций. zχ2z

Мы видели, что существует два разных способа мышления и анализа этих данных (вызванные двумя разными взглядами на данные). Таким образом, мы должны решить, каким образом мы должны использовать. Тест хи-квадрат оценивает, являются ли и независимыми. То есть люди, которые болели заранее, чаще болеют потом, чем люди, которые никогда не болели. Очень трудно понять, как это не будет иметь место, учитывая, что эти измерения оцениваются на одних и тех же объектах. Если вы получили незначительный результат (как вы почти что), то это просто ошибка типа II. Вместо того, чтобы ие тBeforeБ е е о р е е т е р т гAfterBeforeAfterнезависимы, вы почти наверняка хотите знать, работает ли лечение (вопрос хи-квадрат не отвечает). Это очень похоже на любое количество исследований лечения и контроля, где вы хотите увидеть, равны ли средние значения, за исключением того, что в этом случае ваши измерения да / нет, и они относятся к субъектам. Рассмотрим более типичную -тесту ситуацию с артериального давления , измеренного до и после некоторой обработки. Те, чей bp был выше среднего по вашей выборке заранее, почти наверняка будут иметь тенденцию быть среди более высоких bps впоследствии, но вы не хотите знать о последовательности ранжирования, вы хотите знать, привело ли лечение к изменению среднего bp , Ваша ситуация здесь прямо аналогична. В частности, вы хотите запустить в пределах субъектаtzтест на равенство пропорций. Вот что такое тест МакНемара.

Итак, поняв, что мы хотим провести тест Макнемара, как он работает? Провести тест между субъектами легко, но как нам запустить внутрисубъектную версию? Ключом к пониманию того, как выполнить проверку пропорций внутри предмета, является изучение таблицы сопряженности, которая разбивает пропорции:z
B

AеTерNоYеsTоTaLВееореNо1157351192Yеs22013233TоTaL1377481425
ВееореПропорции представляют собой итоги строк, разделенные на общую сумму, а пропорции представляют собой итоги столбцов, разделенные на общую сумму. Когда мы смотрим на таблицу непредвиденных расходов, мы видим, что это, например: Интересно отметить, чтоAеTер
1322035220/(
До пропорции дазнак равно220+131425,После пропорции дазнак равно35+131425
13наблюдения были да как до, так и после. Они в конечном итоге являются частью обеих пропорций, но в результате участия в обоих расчетах они не добавляют четкой информации об изменении пропорции йес. Более того, они учитываются дважды, что недействительно. Аналогичным образом, общая сумма заканчивается в обоих расчетах и ​​не добавляет четкой информации. Разлагая пропорции, мы можем распознать, что единственная четкая информация о пропорциях до и после существует в и , поэтому мы должны проанализировать эти числа. Это было понимание Макнемара. Кроме того, он понял, что при нулевом значении это биноминальный критерий против нулевой доли22035220/(220+35)0,5, (Существует эквивалентная формулировка, которая распределяется как хи-квадрат, что и является Rрезультатом.)

Здесь еще одно обсуждение теста МакНемара с расширениями таблиц сопряженности, превышающими 2x2, здесь .


Вот Rдемо с вашими данными:

mat = as.table(rbind(c(1157, 35), 
                     c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Before", "After")
mat
margin.table(mat, 1)
margin.table(mat, 2)
sum(mat)

mcnemar.test(mat, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 134.2157, df = 1, p-value < 2.2e-16
binom.test(c(220, 35), p=0.5)
#  Exact binomial test
# 
# data:  c(220, 35)
# number of successes = 220, number of trials = 255, p-value < 2.2e-16
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#  0.8143138 0.9024996
# sample estimates:
# probability of success 
#              0.8627451 

Если бы мы не принимали во внимание характер ваших данных внутри объекта, у нас был бы чуть менее мощный тест на равенство пропорций:

prop.test(rbind(margin.table(mat, 1), margin.table(mat, 2)), correct=FALSE)
#  2-sample test for equality of proportions without continuity
#  correction
# 
# data:  rbind(margin.table(mat, 1), margin.table(mat, 2))
# X-squared = 135.1195, df = 1, p-value < 2.2e-16
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#  0.1084598 0.1511894
# sample estimates:
#    prop 1    prop 2 
# 0.9663158 0.8364912 

То есть X-squared = 133.6627вместо chi-squared = 134.2157. В этом случае они очень мало отличаются, потому что у вас много данных, и только случаев перекрываются, как обсуждалось выше. (Другая, и более важная проблема здесь заключается в том, что при этом ваши данные учитываются дважды, т. вместо ) N = 2850 N = 142513Nзнак равно2850Nзнак равно1425


Вот ответы на ваши конкретные вопросы:

  1. Правильный анализ - это тест Макнемара (как подробно обсуждалось выше).
  2. Эта версия более хитрая, и выражение «действительно ли более высокие пропорции одной инфекции связаны с более высокими пропорциями Y» неоднозначно. Есть два возможных вопроса:

    • Вполне разумно узнать, имеют ли пациенты, получающие одну из инфекций, склонность к другой, и в этом случае вы будете использовать критерий независимости по критерию хи-квадрат. Этот вопрос задает вопрос о том, является ли восприимчивость к двум различным инфекциям независимой (возможно, потому, что они заражаются различными физиологическими путями) или нет (возможно, они заключаются из-за общей ослабленной иммунной системы).
    • Также совершенно разумно узнать, имеют ли одинаковые пропорции пациентов склонность к обоим инфекциям, и в этом случае вы бы использовали тест Макнемара. Вопрос здесь в том, одинаково ли вирулентны инфекции.
  3. Поскольку это опять та же инфекция, конечно, они будут связаны. Я понимаю, что эта версия не до и после лечения, а только в какой-то более поздний момент времени. Таким образом, вы спрашиваете, изменяется ли уровень фоновой инфекции органически, что опять-таки является вполне обоснованным вопросом. В любом случае, правильный анализ - это тест Макнемара.
    Изменить: Кажется, я неправильно истолковал ваш третий вопрос, возможно, из-за опечатки. Теперь я интерпретирую это как две разные инфекции в двух разных временных точках. Согласно этой интерпретации, критерий хи-квадрат будет уместным.

@Alexis Насколько я понимаю, ты и Ганг, кажется, говорите друг за другом. Даже так называемый t-тест «непарные» или «независимые выборки», или «односторонние» или «независимые выборки ANOVA», фактически требуют парных данных в смысле gung: для каждого субъекта вы должны записать обе категориальные группы переменная членства и непрерывная переменная результата . (Если переменная членства в группе имеет два уровня, мы обычно используем непарный t-критерий; для уровней 3+ вам нужен односторонний ANOVA).
Серебряная рыба

2
Объясняя, какой тест использовать, я показываю оба способа взглянуть на него - если у вас есть наблюдения по непрерывной переменной, по одному для каждого субъекта, и участники приходят из 2 (или 3+) групп, и вас интересуют различия между групп, затем используйте t-критерий независимых выборок (или односторонний ANOVA). Затем подтвердите свой выбор, посмотрев таблицу данных: у вас есть по каждому предмету две части информации: категория для членства в группе и непрерывная переменная. Мы можем даже изменить ситуацию и сказать, что t-тест - это своего рода тест на связь между двоичной и непрерывной переменными.
Серебряная рыба

2
Парный t-тест (или коррелированные образцы ANOVA) используется, если для каждого субъекта у вас есть два (или более 3) непрерывных показания, взятых в разных условиях, и вы хотите проверить различия между условиями. Это «спаренная» в другом смысле. Но в этом вопросе у нас есть две категориальные переменные, записанные для каждого предмета. Глядя на таблицу данных, записанные значения этих категориальных переменных должны приходить парами. Но это не значит, что сам дизайн исследования является парным. Это сбивает с толку (как отмечает гунг). Но если вы знаете свой дизайн исследования, это может решить его (как отмечает alexis)
Silverfish

@Silverfish Если у вас есть два наблюдения (одной и той же номинальной переменной) по каждому предмету, в каком смысле это не парный дизайн?
Алексис

1
@Alexis Это то, что «одной и той же переменной» является ключевым - и потенциально запутанным. Возможно, вы знаете, что она представляет одну и ту же переменную, хотя и в разных условиях или в разное время, но в зависимости от того, как мы выкладываем таблицу данных, они могут отображаться как разные переменные (например, отдельные «до» и «после»). переменная).
Серебряная рыбка

22

Ну, кажется, я сделал хэш этого. Позвольте мне попытаться объяснить это снова, по-другому, и мы посмотрим, может ли это помочь прояснить ситуацию.

Традиционный способ объяснить критерий Макнемара в сравнении с критерием хи-квадрат состоит в том, чтобы спросить, являются ли данные «парными», и рекомендовать тест МакНемара, если данные являются парными, и тест хи-квадрат, если данные «непарные». Я обнаружил, что это приводит к большой путанице (этот поток является примером!). Вместо этого я обнаружил, что наиболее полезно сосредоточиться на вопросе, который вы пытаетесь задать , и использовать тест, соответствующий вашему вопросу. Чтобы сделать это более конкретным, давайте посмотрим на вымышленный сценарий:

Вы проходите конференцию по статистике, и для каждого статистика, которого вы встречаете, вы записываете, являются ли они из США или Великобритании. Вы также записываете, имеют ли они высокое кровяное давление или нормальное кровяное давление.

Вот данные:

mat = as.table(rbind(c(195,   5),
                     c(  5, 195) ))
colnames(mat)        = c("US", "UK")
rownames(mat)        = c("Hi", "Normal")
names(dimnames(mat)) = c("BP", "Nationality")
mat
#         Nationality
# BP        US  UK
#   Hi     195   5
#   Normal   5 195

На этом этапе важно выяснить, какой вопрос мы хотим задать из наших данных. Здесь можно задать три разных вопроса:

  1. Мы могли бы знать , если категориальные переменные BPи Nationalityсвязаны или независимы;
  2. Мы могли бы задаться вопросом, является ли высокое кровяное давление более распространенным среди американских статистиков, чем среди британских статистиков;
  3. Наконец, мы могли бы задаться вопросом, равна ли доля статистиков с высоким кровяным давлением той доле статистиков США, с которой мы говорили. Это относится к предельным пропорциям таблицы. Они не печатаются по умолчанию в R, но мы можем получить их таким образом (обратите внимание, что в этом случае они точно такие же):

    margin.table(mat, 1)/sum(mat)
    # BP
    #    Hi Normal 
    #   0.5    0.5 
    margin.table(mat, 2)/sum(mat)
    # Nationality
    #  US  UK 
    # 0.5 0.5 

Как я уже сказал, традиционный подход, обсуждаемый во многих учебниках, заключается в определении того, какой тест использовать, основываясь на том, являются ли данные «парными» или нет. Но это очень запутанно, эта таблица непредвиденных обстоятельств "спарена"? Если мы сравниваем соотношение с высоким артериальным давлением между статистиками США и Великобритании, вы сравниваете две пропорции (хотя и с одной и той же переменной), измеренные для разных групп людей. С другой стороны, если вы хотите сравнить пропорцию с высоким кровяным давлением с долей США, вы сравниваете две пропорции (хотя и с разными переменными), измеренные для одного и того же набора людей. Эти данные оба«спаренный» и «непарный» одновременно (хотя и в отношении различных аспектов данных). Это приводит к путанице. Чтобы попытаться избежать этой путаницы, я утверждаю, что вы должны подумать о том, какой вопрос вы задаете. В частности, если вы хотите знать:

  1. Если переменные независимы: используйте критерий хи-квадрат.
  2. Если пропорция с высоким кровяным давлением отличается в зависимости от национальности: используйте z-критерий для определения разницы пропорций.
  3. Если предельные пропорции одинаковы: используйте критерий Макнемара.

Кто-то может не согласиться со мной здесь, утверждая, что, поскольку таблица сопряженности не является «парной», критерий Макнемара не может быть использован для проверки равенства предельных пропорций и что вместо этого следует использовать критерий хи-квадрат. Так как это предмет спора, давайте попробуем оба, чтобы увидеть, имеют ли результаты смысл:

chisq.test(mat)
#  Pearson's Chi-squared test with Yates' continuity correction
# 
# data:  mat
# X-squared = 357.21, df = 1, p-value < 2.2e-16
mcnemar.test(mat)
#  McNemar's Chi-squared test
# 
# data:  mat
# McNemar's chi-squared = 0, df = 1, p-value = 1

Тест хи-квадрат дает значение р приблизительно 0. То есть, он говорит, что вероятность получения данных как можно дальше или дальше от равных предельных пропорций, если предельные пропорции фактически были равны, по существу равна 0. Но предельные пропорции точно так же, , как мы видели выше! Результаты теста хи-квадрат просто не имеют никакого смысла в свете данных. С другой стороны, тест Макнемара дает p-значение 1. То есть, он говорит, что у вас будет 100% шанс найти предельные пропорции, близкие к равенству или дальше от равенства, если истинные предельные пропорции равны. Поскольку наблюдаемые предельные пропорции не могут быть ближе к равным, чем они есть, этот результат имеет смысл. 50%знак равно50%

Давайте попробуем другой пример:

mat2 = as.table(rbind(c(195, 195),
                      c(  5,   5) ))
colnames(mat2)        = c("US", "UK")
rownames(mat2)        = c("Hi", "Normal")
names(dimnames(mat2)) = c("BP", "Nationality")
mat2
#         Nationality
# BP        US  UK
#   Hi     195 195
#   Normal   5   5
margin.table(mat2, 1)/sum(mat2)
# BP
#     Hi Normal 
#  0.975  0.025 
margin.table(mat2, 2)/sum(mat2)
# Nationality
#  US  UK 
# 0.5 0.5 

В этом случае предельные пропорции очень разные, . Давайте попробуем два теста еще раз, чтобы увидеть, как их результаты сравниваются с наблюдаемой большой разницей в предельных пропорциях: 97,5%»50%

chisq.test(mat2)
#  Pearson's Chi-squared test
# 
# data:  mat2
# X-squared = 0, df = 1, p-value = 1
mcnemar.test(mat2)
#  McNemar's Chi-squared test with continuity correction
# 
# data:  mat2
# McNemar's chi-squared = 178.605, df = 1, p-value < 2.2e-16

На этот раз критерий хи-квадрат дает значение p, равное 1, что означает, что предельные пропорции равны, насколько они могут быть. Но мы увидели, что предельные пропорции явно не равны, поэтому этот результат не имеет никакого смысла в свете наших данных. С другой стороны, критерий Макнемара дает p-значение приблизительно 0. Другими словами, крайне маловероятно получить данные с предельными пропорциями, столь же далекими от равенства, как эти, если они действительно равны в популяции. Поскольку наши наблюдаемые предельные пропорции далеко не равны, этот результат имеет смысл.

Тот факт, что тест хи-квадрат дает результаты, которые не имеют смысла, учитывая наши данные, говорит о том, что с использованием теста хи-квадрат здесь что-то не так. Конечно, тот факт, что тест Макнемара дал ощутимые результаты, не доказывает, что он действителен, возможно, это было просто совпадение, но критерий хи-квадрат явно ошибочен.

Давайте посмотрим, сможем ли мы проработать аргумент о том, почему тест МакНемара может быть правильным. Я буду использовать третий набор данных:

mat3 = as.table(rbind(c(190,  15),
                      c( 60, 135) ))
colnames(mat3)        = c("US", "UK")
rownames(mat3)        = c("Hi", "Normal")
names(dimnames(mat3)) = c("BP", "Nationality")
mat3
#         Nationality
# BP        US  UK
#   Hi     190  15
#   Normal  60 135
margin.table(mat3, 1)/sum(mat3)
# BP
#     Hi Normal 
# 0.5125 0.4875 
margin.table(mat3, 2)/sum(mat3)
# Nationality
#    US    UK 
# 0.625 0.375 

На этот раз мы хотим сравнить с и задаться вопросом, могли ли бы те же самые предельные пропорции в населении быть одинаковыми. Поскольку мы сравниваем две пропорции, наиболее интуитивным вариантом будет использование z-критерия равенства двух пропорций. Мы можем попробовать это здесь: 62,5 %51,25%62,5%

prop.test(x=c(205, 250), n=c(400, 400))
#  2-sample test for equality of proportions with continuity correction
# 
# data:  c(205, 250) out of c(400, 400)
# X-squared = 9.8665, df = 1, p-value = 0.001683
# alternative hypothesis: two.sided
# 95 percent confidence interval:
#   -0.18319286 -0.04180714
# sample estimates:
# prop 1 prop 2 
# 0.5125 0.6250 

(Чтобы использовать prop.test()для проверки предельных пропорций, мне пришлось вручную вводить числа «успехов» и общее количество «испытаний», но из последней строки выходных данных видно, что пропорции правильные.) Это говорит о том, что маловероятно, чтобы предельные пропорции были настолько далеки от равенства, если бы они были фактически равны, учитывая количество данных, которые у нас есть.

Этот тест действителен? Здесь есть две проблемы: Тест полагает, что у нас есть 800 данных, тогда как у нас фактически только 400. Этот тест также не учитывает, что эти две пропорции не являются независимыми, в том смысле, что они были измерены на тех же людях.

Посмотрим, сможем ли мы разобрать это на части и найти другой путь. Из таблицы непредвиденных обстоятельств мы можем видеть, что предельные пропорции: То, что мы видим здесь, это то, что американских статистиков с высоким кровяным давлением обнаруживаются в обоих предельных пропорциях. Они оба учитываются дважды и не дают никакой информации о различиях в предельных пропорциях. Более того, общее количество отображается в обоих знаменателях. Вся уникальная и отличительная информация содержится в двух недиагональных ячейках ( и
1904001560π=.5

% высокого АД: 190+15400% США: 190+60400
1904001560). Являются ли предельные пропорции одинаковыми или разными, зависит только от них. В равной степени вероятность того, что наблюдение попадет в одну из этих двух ячеек, распределяется в виде бинома с вероятностью под нулем. Это было понимание Макнемара. На самом деле, тест Макнемара - это всего лишь биномиальный тест того, могут ли наблюдения с равной вероятностью попасть в эти две ячейки: πзнак равно0,5
binom.test(x=15, n=(15+60))
#  Exact binomial test
# 
# data:  15 and (15 + 60)
# number of successes = 15, number of trials = 75, p-value = 1.588e-07
# alternative hypothesis: true probability of success is not equal to 0.5
# 95 percent confidence interval:
#   0.1164821 0.3083261
# sample estimates:
# probability of success 
#                    0.2 

В этой версии используются только информативные наблюдения, и они не учитываются дважды. Здесь значение р намного меньше, 0,0000001588, что часто бывает, когда учитывается зависимость в данных. То есть этот тест является более мощным, чем z-тест разности пропорций. Далее мы можем видеть, что вышеприведенная версия по сути такая же, как тест МакНемара:

mcnemar.test(mat3, correct=FALSE)
#  McNemar's Chi-squared test
# 
# data:  mat3
# McNemar's chi-squared = 27, df = 1, p-value = 2.035e-07

Если неидентичность вводит в заблуждение, критерий Макнемара, как правило, и в R возводит в квадрат результат и сравнивает его с распределением хи-квадрат, которое не является точным тестом, подобным приведенному выше биному:

(15-60)^2/(15+60)
# [1] 27
1-pchisq(27, df=1)
# [1] 2.034555e-07

Таким образом, если вы хотите проверить, что предельные пропорции таблицы сопряженности равны, тест Макнемара (или точный биномиальный тест, вычисленный вручную) является правильным. Он использует только соответствующую информацию без незаконного использования каких-либо данных дважды. Это не просто «результат», чтобы получить результаты, которые имеют смысл данных.

Я продолжаю верить, что попытка выяснить, является ли таблица непредвиденных обстоятельств «парной», бесполезна. Я предлагаю использовать тест, который соответствует вопросу, который вы задаете для данных.


1
Вы получили мой голос. :)
Алексис

11

χ2χ2


χ2

Например, у вас может быть выборка из 20 статистиков из США и отдельная независимая выборка из 37 статистиков из Великобритании, и вы можете измерить, являются ли эти статистики гипертоническими или нормотензивными. Ваша нулевая гипотеза состоит в том, что как британские, так и американские статистики имеют одинаковую базовую вероятность развития гипертонии (т. Е. Знание того, кто из США или Великобритании, ничего не говорит о вероятности гипертонии). Конечно, возможно, что у вас может быть одинаковый размер выборки в каждой группе, но это не меняет факт независимости выборок (то есть непарных ).


χ2

Например, у вас могут быть индивидуально подобранные данные исследования «случай-контроль», взятые из международной конференции статистиков, где 30 статистиков с артериальной гипертензией (случаи) и 30 статистиков без артериальной гипертензии (контроли; индивидуально подбираются по возрасту, полу, ИМТ и статусу курения). в особых случаях), ретроспективно оцениваются на предмет профессионального проживания в Великобритании по сравнению с местом проживания в другом месте. Нулевым является то, что вероятность проживания в Великобритании среди случаев совпадает с вероятностью проживания в Великобритании в качестве контроля (то есть, что знание о своем гипертоническом статусе ничего не говорит об истории проживания в Великобритании).

рsχ2знак равно[(р-s)-1]2(р+s)

Кроме того, в вашем примере ваши данные являются парными (одна и та же переменная, измеренная дважды для одного и того же субъекта), и поэтому тест Макнемара является подходящим выбором теста для ассоциации.

[Gung и я некоторое время не соглашались с более ранним ответом.]

Цитируемые ссылки
«Предполагая, что мы все еще заинтересованы в сравнении пропорций, что мы можем сделать, если наши данные являются парными, а не независимыми? ... В этой ситуации мы используем тест Макнемара». - Пагано и Говро, Принципы биостатистики , 2-й издание, стр. 349. [ Акцент сделан ]

«Выражение более известно как статистика теста согласованных пар McNemar (McNemar, 1949) и является основой анализа согласованных пар », - Ротман, Гренландия и Лэш. Современная эпидемиология , стр. 286. [ Выделение подчеркнуто ]

«Парный t- тест и повторные измерения дисперсионного анализа могут быть использованы для анализа экспериментов, в которых изучаемая переменная может быть измерена в интервальной шкале (и удовлетворяет другим предположениям, требуемым для параметрических методов). Как насчет экспериментов, аналогичных тем в главе 5, где результат измеряется по номинальной шкале? Эта проблема часто возникает, когда спрашивают, ответил ли человек на лечение или сравнивают результаты двух разных диагностических тестов, которые классифицированы как положительные или отрицательные у одних и тех же людей. Мы разработаем процедуру для анализа таких экспериментов, тест Макнемара на изменения , в контексте одного такого исследования ". - Гланц, Учебник по биостатистикеχ2

«Для сопоставленных данных« случай-контроль »с одним контролем на случай анализ результатов прост, и соответствующим статистическим тестом является критерий хи-квадрат Макнемара ... обратите внимание, что для расчета как отношения шансов, так и статистики, единственные вкладчики это пары, которые являются разрозненными в воздействии , то есть пары, где случай был раскрыт, но контроль не был, и те, где контроль был выставлен, но случай не был ". - Элвуд. Критическая оценка эпидемиологических исследований и клинических испытаний , 1-е издание, стр. 189–190. [ Акцент добавлен ]


7

Мое понимание теста Макнемара следующее: оно используется для того, чтобы увидеть, оказало ли вмешательство существенное влияние на бинарный результат. В вашем примере группа субъектов проверяется на наличие инфекции, и ответ записывается как да или нет. Все субъекты затем получают некоторое вмешательство, скажем, антибиотик. Затем они снова проверяются на наличие инфекции, и ответ снова записывается как да / нет. Ответы (пары) могут быть помещены в таблицу соответствия:

             After   
           |no  |yes|
Before|No  |1157|35 |
      |Yes |220 |13 |

И тест Макнемара подойдет для этого.

Из таблицы видно, что гораздо больше из «да» перешло в «нет» (220 / (220 + 13) или 94,4%), чем из «нет» в «да» (35 / (1157 + 35) или 2,9 %). Учитывая эти пропорции, значение P Макнемара (4.901e-31) представляется более правильным, чем значение P хи-квадрат (0.04082).

Если в таблице соответствия указаны 2 разные инфекции (вопрос 2), то хи-квадрат будет более уместным.

Ваш третий вопрос неоднозначен: сначала вы указываете связь Y в момент t2 с Y в момент t1, но в таблице вы пишете «X» в момент времени t1 против Y в момент времени t2. Y в момент времени t2 против Y в момент времени t1 совпадает с вашим первым вопросом, и поэтому необходим тест МакНемара, в то время как значения X в момент времени t1 и Y в момент времени t2 указывают на сравнение различных событий, и, следовательно, хи-квадрат будет более подходящим.

Редактировать: Как упомянуто Алексис в комментарии, сопоставленные данные контроля случая также анализируются тестом Макнемара. Например, 1425 больных раком набираются для исследования, и для каждого пациента также подбирается соответствующий контроль. Все эти (1425 * 2) проверены на наличие инфекции. Результаты каждой пары могут быть показаны по аналогичной таблице:

             Normal   
           |no  |yes|
Cancer|No  |1157|35 |
      |Yes |220 |13 |

Более четко:

                                    Normal:
                                    No infection   Infection  
Cancer patient:     No infection    1157            35      
                    Infection       220             13      

Это показывает, что больной раком гораздо чаще заражался инфекцией, а контроль - нет, а не наоборот. Его значение может быть проверено тестом Макнемара.

Если эти пациенты и контроли не были сопоставлены и независимы, можно только составить следующую таблицу и выполнить критерий квадратуры:

            Infection
            No    Yes
Cancer  No  1377   48
        Yes 1192  233

Более четко:

                No infection        Infection
No cancer       1377                48
Cancer          1192                233

Обратите внимание, что эти числа совпадают с полями первой таблицы:

> addmargins(mat)
      After
Before   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425

Это должно быть причиной использования таких терминов, как «предельные частоты» и «предельная однородность» в тесте Макнемара.

Интересно, что функция addmargins также может помочь решить, какой тест использовать. Если общая сумма составляет половину от числа наблюдаемых объектов (что указывает на спаривание), тогда применяется критерий Макнемара, в противном случае уместен критерий чисел:

> addmargins(mat)
      Normal
Cancer   No  Yes  Sum
   No  1157   35 1192
   Yes  220   13  233
   Sum 1377   48 1425
> 
> addmargins(mat3)
      Infection
Cancer   No  Yes  Sum
   No  1377   48 1425
   Yes 1192  233 1425
   Sum 2569  281 2850

Коды R для таблиц выше приведены в ответах выше:

mat = as.table(rbind(c(1157, 35), 
                      c( 220, 13) ))
colnames(mat) <- rownames(mat) <- c("No", "Yes")
names(dimnames(mat)) = c("Cancer", "Normal")

mat3 = as.table(rbind(c(1377, 48), 
                     c(1192, 233) ))
colnames(mat3) <- rownames(mat3) <- c("No", "Yes")
names(dimnames(mat3)) = c("Cancer", "Infection")

Следующий псевдокод также может помочь узнать разницу:

subject_id      result_first_observation    result_second_observation   
1               no                          yes                     
2               yes                         no                      
...

mcnemar.test(table(result_first_observation, result_second_observation))



pair_id     result_case_subject     result_control_subject  
1           no                      yes                     
2           yes                     no                      
...

mcnemar.test(table(result_case_subject, result_control_subject))



subject_id      result_first_test       result_second_test
1               yes                     no
2               no                      yes
..

chisq.test(table(result_first_test, result_second_test))

Редактировать:

mid-pинтересен вариант проведения теста Макнемара ( https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3716987/ ). Он сравнивает bи cтаблицу непредвиденных обстоятельств, т.е. число, которое изменилось с «да» на «нет», и число, которое изменилось с «нет» на «да» (игнорируя число тех, кто оставался «да» или «нет» в ходе исследования). Это может быть выполнено с использованием биномиального теста в Python, как показано на https://gist.github.com/kylebgorman/c8b3fb31c1552ecbaafb

Это может быть эквивалентно тому, что binom.test(b, b+c, 0.5)при случайном изменении можно ожидать, bчто оно будет равно c.


3
Не только для анализа вмешательства: он используется для анализа сопоставленных данных «случай-контроль» в наблюдательном смысле.
Алексис

Учитывая описание / настройку до таблицы для Q3, я подозреваю, что «X» - это опечатка, но это был хороший улов, и это полезный вклад в тему +1.
gung - Восстановить Монику

@mso Отредактировано Q3. это Х в момент времени t1! в противном случае, как вы говорите, он не отличается от Q1. Этому Вопросу больше года, и он удивлен, когда к нему кто-то возвращается с такими же мыслями, которые смутили меня. После с большим интересом!
Anto

Мои извинения, ОП уточнил Q3, очевидно, это 2 разных заболевания в 2 разных времени. Опять хороший улов.
gung - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.