Я проверяю независимость двух переменных, A и B, стратифицированных по C. A и B являются двоичными переменными, а C является категориальным (5 значений). Выполняя точный тест Фишера для A и B (все слои объединены), я получаю:
## (B)
## (A) FALSE TRUE
## FALSE 1841 85
## TRUE 915 74
OR: 1.75 (1.25 -- 2.44), p = 0.0007 *
где ИЛИ - отношение шансов (оценка и 95% доверительный интервал), и *
означает, что р <0,05.
Запустив один и тот же тест для каждого слоя (C), я получаю:
C=1, OR: 2.31 (0.78 -- 6.13), p = 0.0815
C=2, OR: 2.75 (1.21 -- 6.15), p = 0.0088 *
C=3, OR: 0.94 (0.50 -- 1.74), p = 0.8839
C=4, OR: 1.48 (0.77 -- 2.89), p = 0.2196
C=5, OR: 3.38 (0.62 -- 34.11), p = 0.1731
Наконец, запустив тест Cochran-Mantel-Haenszel (CMH), используя A, B и C, я получаю:
OR: 1.56 (1.12 -- 2.18), p = 0.0089 *
Результат теста CMH позволяет предположить, что А и В не являются независимыми в каждом слое (р <0,05); тем не менее, большинство внутрипластовых тестов были несущественными, что предполагает, что у нас нет достаточных доказательств, чтобы отказаться от того, что А и В независимы в каждом слое.
Итак, какой вывод правильный? Как сообщить о заключении с учетом этих результатов? Можно ли считать C смешанной переменной или нет?
РЕДАКТИРОВАТЬ: я выполнил тест Breslow-Day для нулевой гипотезы, что отношение шансов является одинаковым для всех слоев, и р-значение было 0,1424.