Является ли хи-квадрат всегда односторонним тестом?


48

Опубликованная статья ( pdf ) содержит эти 2 предложения:

Кроме того, искажение информации может быть вызвано применением неправильных правил или недостаточным знанием статистического теста. Например, общее значение df в ANOVA может быть принято за ошибку df в отчете о тесте, или исследователь может разделить сообщаемое значение p теста или на два, чтобы получить одностороннее значение , тогда как значение теста или уже является односторонним.Fχ2Fppχ2F

Почему они могли это сказать? Тест хи-квадрат - двусторонний тест. (Я спросил одного из авторов, но не получил ответа.)

Я что-то пропускаю?


Взгляните на упражнение 4.14 издания Davidson & Mackinnon «Econometric Theory and Methods» 2004 года, чтобы увидеть (исключительный) пример использования хи-квадрат для двустороннего теста. Изменить: отличное объяснение здесь: itl.nist.gov/div898/handbook/eda/section3/eda358.htm
Макс

Ответы:


50

Тест хи-квадрат по сути всегда является односторонним тестом . Вот свободный способ думать об этом: критерий хи-квадрат - это, в основном, тест «на соответствие». Иногда это явно упоминается как таковое, но даже если это не так, оно все еще часто по существу является хорошим дополнением. Например, критерий независимости по критерию хи-квадрат в таблице частот 2 x 2 является (своего рода) тестом соответствия первого ряда (столбца) распределению, указанному во втором ряду (столбце), и наоборот одновременно. Таким образом, когда осознанное значение хи-квадрат находится далеко справа от его распределения, это указывает на плохое соответствие, и, если оно достаточно далеко, относительно некоторого заранее заданного порога, мы можем заключить, что оно настолько мало, что мы не считаем, что данные взяты из этого справочного распределения.

Если бы мы использовали критерий хи-квадрат в качестве двустороннего теста, мы также были бы обеспокоены, если бы статистика находилась слишком далеко в левой части распределения хи-квадрат. Это будет означать, что мы беспокоимся, что подгонка может быть слишком хорошей . Это просто не то, о чем мы обычно беспокоимся. (Как историческая справка, это связано со спором о том, обманул ли Мендель свои данные. Идея заключалась в том, что его данные были слишком хороши, чтобы быть правдой. Если вам интересно, см. Здесь дополнительную информацию.)


9
+1 за упоминание о двустороннем использовании экспериментов с горохом Менделя: это запоминающееся и доходит до сути вопроса.
whuber

2
+1 за хороший вопрос и отличный ответ. @Joel W: Я настоятельно рекомендую видео Хана Академиса о тестеχ2
Макс Гордон

9
Мое краткое изложение этого заключается в том, что - это двусторонний тест, для которого нас обычно интересует только один из хвостов распределения, указывающий на большее несогласие, а не меньшее несогласие, чем можно ожидать случайно. χ2
Фрэнк Харрелл

5
Поддержка двухстороннего представления: «Вероятность двух хвостов за +/- z для стандартного нормального распределения равна вероятности правого хвоста выше z-квадрата для распределения хи-квадрат с df = 1. Например, стандартная нормальная вероятность, равная 0,05, которая падает ниже -1,96 и выше 1,96, равна вероятности хи-квадрат для правого хвоста выше (1,96) в квадрате = 3,84 при df = 1. " Agresti, 2007 (2-е изд.), Стр. 11
Джоэл В.

5
Верно. Возведение в квадрат z-показателя приводит к изменению хи-квадрат. Например, az 2 (или -2!), Когда квадрат равен 4, соответствующее значение хи-квадрат. Двустороннее значение р, связанное с z-показателем 2, равно 0,04550026; и одностороннее значение р, связанное со значением хи-квадрат 4 (df = 1), равно 0,04550026. Двусторонний z-тест соответствует одностороннему критерию хи-квадрат. Просмотр левого хвоста распределения хи-квадрат будет соответствовать поиску z-показателей, которые ближе к z = 0, чем вы можете ожидать случайно.
gung - Восстановить Монику

12

Является ли хи-квадрат всегда односторонним тестом?

Это действительно зависит от двух вещей:

  1. какая гипотеза проверяется. Если вы проверяете отклонение нормальных данных от заданного значения, вполне возможно иметь дело с верхним или нижним хвостами хи-квадрата (односторонний) или обоими хвостами распределения. Мы должны помнить, что статистика типа - не единственные тесты хи-квадрат в городе!(OE)2E

  2. говорят ли люди об альтернативной гипотезе, являющейся односторонней или двусторонней (потому что некоторые люди используют «двусторонний» для обозначения двусторонней альтернативы, независимо от того, что происходит с распределением выборки статистики . Иногда это может быть Так что, например, если мы смотрим на тест пропорций с двумя выборками, кто-то может в нулевой записи написать, что эти две пропорции равны, и в альтернативной записи, чтоπ1π2и затем говорите о нем как о «двухстороннем», но тестируйте его, используя хи-квадрат, а не z-критерий, и поэтому смотрите только на верхний хвост распределения тестовой статистики (так что это два хвоста с точки зрения распределение разницы в пропорциях выборки, но одно из них в терминах распределения статистики хи-квадрат, полученной из этого - во многом так же, как если вы сделаете свой t-тест statistc , вы будете только глядя на один хвост в распределении ).|T||T|

То есть мы должны быть очень осторожны с тем, что мы хотим охватить с помощью «критерия хи-квадрат», и уточнить, что мы имеем в виду, когда говорим «односторонний» или «двусторонний».

В некоторых обстоятельствах (два я упомянул; может быть и больше) может иметь смысл называть его двусторонним, или разумно называть его двусторонним, если вы допускаете некоторую слабость в использовании терминологии.

Это может быть разумным утверждением, чтобы сказать, что это только один хвост, если вы ограничиваете обсуждение определенными видами тестов хи-квадрат.



Большое спасибо за упоминание теста на дисперсию. На самом деле это довольно интересное использование теста, а также причина, по которой я оказался на этой странице ^^
Тобби

5

Критерий хи-квадрат гипотезы о том, что дисперсия может быть либо одно-, либо двусторонним в том же смысле, что и t-критерий гипотезы о том, что среднее значение может быть либо одно-, либо двусторонним.σ 2 ( m - μ ) (n1)s2/σ2σ2μ(mμ)n/sμ


1

Ответ @ gung верен и является способом чтения . Тем не менее, путаница может возникнуть из другого чтения:χ2

Было бы легко интерпретировать как «двусторонний» в том смысле, что тестовая статистика обычно состоит из суммы квадратов разностей с обеих сторон исходного распределения.χ2

Это чтение будет путать, как генерировалась статистика теста, с какими хвостами статистики теста просматривается.


Не могли бы вы уточнить, какой будет «сторона оригинального дистрибутива»? Даже не очевидно, к чему относится это «исходное распределение», и как оно связано со статистикой хи-квадрат, рассчитанной по данным.
whuber

Например, сумма независимых квадратов нормалей равна . Нормы - это «оригинальное» распределение. стат включает в себя информацию из обоего хвостов , лежащего в основе нормального распределения. χ 2 χ 2nχ2χ2
предположения

Хорошо, но я до сих пор не могу понять, с чем вы это противопоставляете. Не могли бы вы привести пример двухсторонней тестовой статистики, которую можно использовать в ANOVA, и показать, как она связана с хвостами некоторого распределения?
whuber

Я не сравниваю это ни с чем. Я указываю причину, по которой люди могут запутаться по поводу одностороннего / двустороннего жаргона в контексте . Эксперты сразу увидят, что сам тест обычно является односторонним тестом для вычисляемой статистики. Другие могут иметь некоторые данные и думать об отклонениях от среднего значения в обоих направлениях, которые часто сводятся в статистику . Они услышат что-то вроде «размышления об отклонениях от среднего в обоих направлениях = двусторонний тест». Отсюда недоразумение. х 2 х 2χ2χ2χ2
предположения

Я прошу контраст только для того, чтобы помочь понять, что вы пытаетесь описать. Я еще не смог определить что это.
whuber

0

У меня также были некоторые проблемы, чтобы разобраться и с этим вопросом, но после некоторых экспериментов мне показалось, что моя проблема была просто в том, как называются тесты.

Например, в SPSS таблица 2x2 может содержать критерий числового критерия. Там есть два столбца для p-значений, один для «Pearson Chi-Sqare», «Continuity Correction» и т. Д., И еще одна пара столбцов для точного теста Фишера, где есть один столбец для 2-стороннего теста и другой для 1-сторонний тест.

Сначала я подумал, что 1- и 2-сторонние обозначают 1- или 2-стороннюю версию теста на квадрат, что кажется странным. Однако оказалось, что это обозначает основную формулировку альтернативной гипотезы в тесте разницы между пропорциями, то есть z-критерия. Таким образом, часто разумный двусторонний критерий пропорций достигается в SPSS с помощью критерия квадратуры, где показатель квадратуры сравнивается со значением в (1-стороннем) верхнем хвосте распределения. Думаю, это то, на что уже указывали другие ответы на первоначальный вопрос, но мне потребовалось некоторое время, чтобы осознать это.

Кстати, такая же формулировка используется в openepi.com и, возможно, в других системах.



0

( n - 1 ) s 2χ2 дисперсионный тест может быть односторонним или двухсторонним: статистика теста равна , а нулевая гипотеза: s (выборочное отклонение) = (справочное значение). Альтернативная гипотеза может быть: (a) , (b) , (c) . p-значение caculation включает в себя асимметрию распределения. σs>σs<σsσ(n1)s2σ2σs>σs<σsσ


1
Добро пожаловать в резюме! Я думаю, что ответ Рэя Купмана уже охватывает этот вопрос.
Серебряная рыбка,

-1

и F тесты односторонне тесты , потому что мы никогда не иметь отрицательные значения и F. Для , сумма разности наблюдаемых и ожидаемых в квадрат делится на ожидаемый (доля ), таким образом, хи-квадрат всегда является положительным числом или может быть близко к нулю с правой стороны, когда нет разницы. Таким образом, этот тест всегда является односторонним тестом с правой стороны. Объяснение для F теста аналогично.х 2 х 2χ2χ2χ2

Для теста F мы сравниваем дисперсию группы с суммой дисперсий внутри группы (среднеквадратичная ошибка с . Если сумма квадратов между и внутри равна, мы получаем значение F, равное 1.SSwdfw

Поскольку это, по сути, отношение суммы квадратов, значение никогда не становится отрицательным числом. Таким образом, у нас нет левого теста, а F-тест всегда является правосторонним односторонним тестом. Проверьте значения и F, они всегда положительны. Для обоих тестов вы смотрите, находится ли вычисленная статистика справа от критического значения. χ2

Хи-квадрат и F распределения


1
Тестовая статистика не должна принимать отрицательные значения, чтобы мы рассмотрели оба хвоста. Например, рассмотрим F-критерий для отношения двух дисперсий.
Glen_b

F test - это односторонний тест Glen_b.
Даниэль

3
F-критерий равенства дисперсий, который имеет статистику, представляющую собой отношение двух оценок дисперсии, НЕ является односторонним; есть приближение к нему, которое помещает большую из двух выборочных вариаций в числитель, но это действительно правильно, если df одинаковы. Но если вам это не нравится, есть множество других примеров. Статистика для теста суммы рангов не может быть отрицательной, но тест состоит из двух частей. При необходимости я могу предоставить другие примеры.
Glen_b

@Ferdi К сожалению, в этом примере что-то явно не так - он говорит, что он двусторонний, но подразумевает, что он отклоняет только большие значения статистики. Если бы было меньше, чем мы бы почти никогда не наблюдали большое значение для отношения, поэтому статистика будет отклоняться только тогда, когда делает его односторонним. σ 2 2 σ 2 1 > σ 2 2σ12σ22σ12>σ22
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.