Из-за ваших комментариев я сделаю два отдельных раздела:
р-значение
В тестировании статистических гипотез вы можете найти «статистические доказательства» альтернативной гипотезы; Как я объяснил в разделе Что следует, если мы не сможем отвергнуть нулевую гипотезу? , это похоже на «доказательство от противного» в математике.
Поэтому, если мы хотим найти «статистическое доказательство», мы предполагаем обратное, которое мы обозначаем того, что мы пытаемся доказать, что мы называем H 1 . После этого мы рисуем образец, а из него вычисляем так называемую статистику теста (например, t-значение в t-тесте).H0H1
Затем, поскольку мы предполагаем, что истинно и что наша выборка случайным образом взята из распределения под H 0 , мы можем вычислить вероятность наблюдения значений, которые превышают или равны значению, полученному из нашей (случайной) выборки. Эта вероятность называется р-значением.H0H0
Если это значение «достаточно мало», то есть меньше, чем уровень значимости, который мы выбрали, то мы отвергаем и считаем, что H 1 «статистически доказано».H0H1
В этом способе важно несколько вещей:
- мы получили вероятности в предположении, что верноH0
- мы взяли случайную выборку из искажения, которое предполагалось при H0
- мы решили найти доказательства для если тест-статистика, полученная из случайной выборки, имеет низкую вероятность превышения. Поэтому не исключено, что оно превышено, пока H 0 истинно, и в этих случаях мы делаем ошибку типа I. H1H0
Итак, что же такое ошибка типа I: ошибка типа I возникает, когда выборка, случайным образом взятая из , приводит к выводу, что H 0 является ложным, тогда как в действительности оно истинно.H0H0
Обратите внимание , что это означает , что р-значение не вероятность ошибки типа I . Действительно, ошибка типа I - это неправильное решение теста, и решение может быть принято только путем сравнения p-значения с выбранным уровнем значимости, с одним только p-значением решение не может быть принято, это только после сравнения p-значение для выбранного уровня значимости, по которому принимается решение , и пока решение не принято, ошибка типа I даже не определяется.
Что тогда является p-значением? Потенциально неправильное отклонение связано с тем, что мы рисуем случайную выборку под H 0 , поэтому может случиться так, что у нас будет «неудача» при рисовании выборки, и эта «неудача» приведет ложное отклонение H 0 . Таким образом, значение p (хотя это не совсем правильно) больше похоже на вероятность получения «плохой выборки». Правильная интерпретация значения p состоит в том, что это вероятность того, что тестовая статистика превышает или равна значению тестовой статистики, полученной из случайно выбранной выборки при H 0H0H0H0H0
Скорость ложного обнаружения (FDR)
Как объяснено выше, каждый раз, когда нулевая гипотеза отклоняется, каждый рассматривает это как «статистическое доказательство» для . Итак, мы нашли новое научное знание, поэтому оно называется открытием . Выше также объясняется, что мы можем делать ложные открытия (то есть ложно отвергать H 0 ), когда совершаем ошибку типа I. В этом случае у нас ложное убеждение в научной истине. Мы только хотим обнаружить действительно правдивые вещи, и поэтому стараемся свести к минимуму ложные открытия, то есть каждый будет контролировать ошибку типа I. Нетрудно понять, что вероятность ошибки типа I является выбранным уровнем значимости α . Поэтому для того , чтобы контролировать наличие ошибок I типа, один фиксирует альфаH1H0ααуровень, отражающий вашу готовность принять «ложное доказательство».
Интуитивно понятно, что это означает, что если мы рисуем огромное количество образцов, и с каждым образцом мы проводим тест, то доля этих тестов приведет к неверному выводу. Важно отметить, что мы «усредняем по многим выборкам» ; так же тест, много образцов. α
α
FDDH0
Таким образом, вероятность ошибки типа I связана с выполнением одного и того же теста на разных образцах. Для огромного количества выборок вероятность ошибки типа I будет сходиться к количеству выборок, ведущих к ложному отклонению, деленному на общее количество взятых выборок .
H0
Обратите внимание, что, сравнивая два абзаца выше:
- Контекст другой; один тест и много образцов против многих тестов и один образец.
- Знаменатель для вычисления вероятности ошибки типа I явно отличается от знаменателя для вычисления FDR. Числители в некотором роде похожи, но имеют другой контекст.
H00,38 × 1000
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is true
Значение p представляет априорную вероятность ошибки типа I, то есть отклонения нулевой гипотезы в предположении, что она верна.