Апостериорный тест для критерия пригодности хи-квадрат

Я провожу тест на соответствие критерию хи-квадрат (GOF) с тремя категориями и специально хочу проверить нулевое, что пропорции населения в каждой категории равны (то есть пропорция составляет 1/3 в каждой группе):

НАБЛЮДЕННЫЕ ДАННЫЕ
Группа 1 Группа 2 Группа 3 Всего
686 928 1012 2626

Таким образом, для этого теста GOF ожидаемые значения составляют 2626 (1/3) = 875,333, и тест дает очень значимое p- значение <0,0001.

Теперь очевидно, что группа 1 значительно отличается от 2 и 3, и вряд ли 2 и 3 значительно отличаются. Тем не менее, если бы я хотел проверить все это формально и быть в состоянии предоставить p- значение для каждого случая, какой метод будет подходящим?

Я искал по всему онлайн, и, кажется, есть разные мнения, но без официальной документации. Мне интересно, есть ли текст или рецензируемый документ, который обращается к этому.

Мне кажется разумным, в свете значительного общего теста, провести z- тесты на разницу в каждой паре пропорций, возможно, с поправкой на значение (например, Bonferroni). $\alpha$

— Мэг
источник

t-тесты не подойдут. Вы можете выполнить попарные тесты на пригодность (тесты пропорций). Какие разные мнения вы нашли?

— Glen_b

Извините - я имел в виду z-тест (для разницы в двух пропорциях). Я отредактирую

— Мег

Эта ссылка говорит о группировке всех других групп по сравнению с интересующей (это для точного теста Фишера, но эта ссылка перенаправлена с другой ссылки о хи-квадрат, где автор говорит, чтобы применить тот же метод для хи-квадрат что касается точного Фишера): biostathandbook.com/exactgof.html#posthoc Но это не совсем то, чего я хочу - я хочу попарно, а не одну группу против всех остальных.

— Мег

Я обнаружил, что в большинстве других источников говорится о настройке таблицы непредвиденных расходов, а не о тесте GOF.

— Мег

Да, вы можете проводить тесты пропорций (будь то z-критерий с одной выборкой, биноминальный критерий или критерий хи-квадрат) каждого парного сравнения. Вам не нужно делать сравнения один против всех.

— Glen_b

Ответы:

К моему удивлению, пара поисков, похоже, не привела к предварительному обсуждению вопроса о пригодности; Я предполагаю, что, возможно, где-то здесь есть один, но так как я не могу найти его легко, я думаю, что разумно превратить мои комментарии в ответ, чтобы люди могли по крайней мере найти это, используя те же самые поисковые термины, которые я только что использовал.

Парные сравнения, которые вы стремитесь выполнить (при условии сравнения только двух участвующих групп), имеют смысл.

Это равносильно взятию групповых пар и проверке, отличается ли пропорция в одной из групп от 1/2 (тест пропорций одной выборки). Это, как вы предлагаете, может быть выполнено в виде z-теста (хотя биномиальный тест и добротность хи-квадрат также подойдут).

Многие из обычных подходов к работе с общей частотой ошибок типа I должны работать здесь (включая Bonferroni - наряду с обычными проблемами, которые могут идти с этим).

— Glen_b - Восстановить Монику
источник

Спасибо за ваш совет и за размещение в качестве ответа. Я тоже был немного удивлен, что этот вопрос, похоже, не подходит для дела GOF.

— Мег

Я тоже удивился, так как этот вопрос не обсуждается. Я пришел к тому же решению, что и Глен, но все еще сомневаюсь. Во-первых, каждая пара не является независимой от «глобальной» выборки. Например, представьте, что у нас 70,16,14, поэтому вы предлагаете сравнить 16 и 14 с 15/15. Тем не менее, в других наблюдениях это может быть 72,14,14. т. е. источником «превосходства» в паре может быть не аналог в паре. Во-вторых, должны ли мы применить некоторую групповую корректировку, такую как Бонферрони, если выбор не был на самом деле независимым? В-третьих, следует ли нам различать, был ли выбор взаимоисключающим или это был множественный выбор?

— Никср

Мне интересно, можно ли использовать для этой цели Кокрановский Q-критерий с МакНемаром? Кажется, что все условия для этого теста выполнены: 1) стадия контроля - равномерное распределение 2) событие - реакция на стимулы 3) это парное сравнение (между гипотетическим случайным выбором и фактическим выбором) 4) ноль - реакция на стимул отличается от случайной

— Никср

so you suggest compare 16 and 14 against 15/15@ Никср, нет. Глен сравнивает две группы в 50/50процентах. 3-я группа исключена из сравнения.

— ttnphns

Да, я имел в виду 16 и 14 это случаи, а не проценты.

— Никср

У меня была такая же проблема (и был счастлив найти этот пост). Я также нашел короткую заметку по этому вопросу в Sheskin (2003: 225), которой я просто хотел поделиться:

«Другим типом сравнения, которое можно провести, является сравнение двух исходных шести ячеек друг с другом. В частности, давайте предположим, что мы хотим сравнить ячейку l / понедельник с ячейкой 2 / вторник [...] Обратите внимание, что в Приведенный выше пример, поскольку мы используем только две ячейки, вероятность для каждой ячейки будет равна π_i = 1/2. Ожидаемая частота каждой ячейки получается умножением π_i = 1/2 на общее количество наблюдений в двух ячейках (которое равно 34). Как отмечалось ранее, при проведении сравнения, такого как приведенное выше, критический вопрос, который должен решить исследователь, заключается в том, какую ценность альфа использовать при оценке нулевой гипотезы ».

Шескин Д.Ю. 2003. Справочник по параметрическим и непараметрическим статистическим процедурам: третье издание. CRC Press.

— Карен
источник