У меня есть перекрестные данные в таблице 2 x 2 x 6. Давайте назовем размеры response
, A
и B
. Я подгоняю логистическую регрессию к данным с помощью модели response ~ A * B
. Анализ отклонения этой модели говорит о том, что оба термина и их взаимодействие являются значительными.
Однако, глядя на пропорции данных, кажется, что только 2 или около того уровня B
ответственны за эти существенные эффекты. Я хотел бы проверить, какие уровни являются виновниками. Прямо сейчас мой подход состоит в том, чтобы выполнить 6 тестов хи-квадрат на 2 x 2 таблицах response ~ A
, а затем скорректировать значения p из этих тестов для множественных сравнений (используя корректировку Холма).
У меня вопрос, есть ли лучший подход к этой проблеме. Существует ли более принципиальный подход к моделированию или метод сравнения нескольких хи-квадрат тестов?