Как работает тест Пиарсона «Чи-квадрат»

После недавнего отрицательного голосования я пытался проверить свое понимание теста Пирсона Чи в квадрате. Я обычно использую статистику хи-квадрат (или уменьшенную статистику хи-квадрат) для подгонки или проверки результирующей подгонки. В этом случае дисперсия обычно представляет собой не ожидаемое количество отсчетов в таблице или гистограмме, а некоторую экспериментально определенную дисперсию. В любом случае, у меня всегда было впечатление, что в тесте все еще используется асимптотическая нормальность полиномиального PDF (т.е. моя статистика теста

Q = (n - N m)^{⊤} V^{- 1} (n - N m)

$Q = (n-Nm)^\top V^{-1}(n-Nm)$

и асимптотически мультинормальна, где - ковариационная матрица). Следовательно, имеет распределение хи-квадрат при больших поэтому использование ожидаемого количества отсчетов в качестве знаменателя в статистике становится действительным для больших . Вполне возможно, что это верно только для гистограмм, я не анализировал небольшую таблицу данных в течение многих лет. $(n-Nm)$ $V$ $Q$ $n$ $n$

Есть ли более тонкий аргумент, который я пропускаю? Мне было бы интересно получить ссылку или, еще лучше, краткое объяснение. (Хотя это возможно, я только что проголосовал за то, что пропустил слово «асимптотика», что, я признаю, довольно важно.)

chi-squared histogram

— котелок
источник

Исходя из этого, по-видимому, также верно, что можно использовать точно такой же тест с любыми нормально распределенными данными. Если бы я использовал вольтметр, который, как я знал, имел какую-то нормально распределенную ошибку, которую я определил, я мог бы использовать, . Это правда? Предполагается, что приведенная статистика хи-квадрат опирается на этот факт.

χ^{2} = \sum_{i} \frac{(V_{o b s} - V_{e x p})^{2}}{σ^{2}}

$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$

— Боулер

Тест хи-квадрат предназначен для анализа категориальных данных. Это означает, что данные были подсчитаны и разделены на категории. Он не будет работать с параметрическими или непрерывными данными. Так что это не работает, чтобы определить результирующее соответствие в каждом случае.

Источник: http://www.ling.upenn.edu/~clight/chisquared.htm

— BradHanks
источник

Добро пожаловать на этот сайт! Я не уверен, чтобы понять, как это относится к рассматриваемому вопросу. Не могли бы вы немного расширить этот ответ, имея в виду, что этот поток, вероятно, больше посвящен проверке соответствия, чем анализу двухсторонних таблиц сопряженности?

— ХЛ

Возможно, я неправильно понял вопрос, но мне было интересно, подходит ли критерий хи-квадрат в этом примере. Я мог бы быть немного ржавым ...

— BradHanks

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$