Какова статистика теста в точном тесте Фишера?


9

Для таблицы непредвиденных обстоятельств 2 на 2 некоторые говорили, что точный тест Фишера использует счет в ячейке (1,1) в таблице в качестве статистики теста, и при нулевой гипотезе будет имеют гипергеометрическое распределение.Икс1,1Икс1,1

Некоторые говорили, что его тестовая статистика

|Икс1,1-μ|
где μ - среднее гипергеометрического распределения (упомянутое выше) при нуле. Также сказано, что p-значения определяются на основе таблицы гипергометрического распределения. Мне было интересно, если есть какая-то причина, чтобы вычесть среднее, а затем принять абсолютное значение? |Икс1,1-μ|не имеет гипергеометрического распределения при нуле, не так ли?

Ответы:


10

(Чтобы сделать наши представления немного более точными, давайте назовем «тестовую статистику» распределением того, что мы ищем, чтобы фактически вычислить p-значение. Это означает, что для двустороннего t-теста наша тестовая статистика будет |T| а не T )

Что делает тестовая статистика , так это вызывать упорядочение в пространстве выборки (или, точнее, частичное упорядочение), чтобы вы могли определить крайние случаи (те, которые наиболее соответствуют альтернативе).

В случае точного теста Фишера, в некотором смысле уже есть порядок - вероятности самих таблиц 2х2. Как это происходит, они соответствуют порядку на в том смысле, что либо самые большие, либо самые маленькие значения являются «экстремальными», и они также являются значениями с наименьшей вероятностью. Поэтому вместо того, чтобы смотреть на значения так, как вы предлагаете, можно просто работать с больших и малых концов, на каждом шаге просто добавляя любое значение (наибольшее или наименьшееИкс1,1Икс1,1Икс1,1Икс1,1-значение, которого там еще нет) имеет наименьшую вероятность, связанную с ним, и продолжается до тех пор, пока вы не достигнете своей наблюдаемой таблицы при его включении общая вероятность всех этих крайних таблиц является p-значением.

Вот пример:

гипергеометрическая функция вероятности

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

Первый столбец - значения , второй столбец - вероятности, а третий столбец - индуцированный порядок.Икс1,1

Таким образом, в конкретном случае точного теста Фишера вероятность каждой таблицы (эквивалентно каждому значению ) может рассматриваться как фактическая статистика тестаИкс1,1 .

Если вы сравните предложенную статистику тестав этом случае он вызывает такое же упорядочение (и я полагаю, что это происходит в целом, но я не проверял), поскольку большие значения этой статистики являются меньшими значениями вероятности, поэтому его можно в равной степени считать «статистикой». - но так же могут быть и многие другие величины - в действительности, любые, которые сохраняют это упорядочение во всех случаях, являются эквивалентной статистикой теста, потому что они всегда дают одинаковые p-значения.|Икс1,1-μ|Икс1,1

Икс1,1

[Редактировать: некоторые программы предоставляют статистику теста для теста Фишера; Я предполагаю, что это будет вычисление типа -2logL, которое будет асимптотически сопоставимо с хи-квадратом. Некоторые могут также представить отношение шансов или его журнал, но это не совсем эквивалентно.]


Икс1,1μ|Икс1,1-μ|

Это очень разумная статистика теста, так как она полностью интерпретируема и понятна. Действительно, ни одна из возможных статистик не будет иметь симметричного распределения. Давайте на минутку забудем специфику теста Фишера - если эта статистика имеет для вас значение, вы можете рассчитать точный тест на этой основе (используя гипергеометрические вычисления, чтобы найти вероятности). Если вы хотите показать, что они вызывают одинаковое упорядочение во всех случаях, это, вероятно, новый вопрос.
Glen_b

6

|Икс1,1-μ|μ|Икс1,1-μ|Икс1,1

Икс1,1КWВИкс1,1ВWК


4

На самом деле его нет. Тестовая статистика - это историческая аномалия - единственная причина, по которой у нас есть тестовая статистика, - это получить значение p. Точный тест Фишера перепрыгивает статистику теста и переходит прямо к p-значению.


Спасибо, а разве нет тестовой статистики? Как вы определяете значение р тогда?
Тим

Результатом точного теста Фишера является значение p.
Джереми Майлз

@JeremyMiles: Вы имеете в виду, что статистика тестов является историческими аномалиями в том, что до недорогих вычислений пользователи вычисляли Z, t и т. Д., А затем сравнивали эту статистику теста с предварительно вычисленными таблицами, чтобы определить статистическую значимость, и, как результат, многие нынешние пользователи логической статистики все еще думают с точки зрения статистики тестов, когда они могли бы так же легко предоставить p-значение? Другими словами, это своего рода эффект поколения?
rabidotter

1
@rabidotter - да, наверное. Вы видите людей, которые пишут «F = 14,352, df = 2, 568, р <0,05». Практически единственная причина, по которой все заботятся о F, - это вычисление P, но они дают F с большой точностью, а p с очень маленькой точностью.
Джереми Майлз
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.