Диалог между учителем и вдумчивым учеником
Смиренно утверждал, что в этой теме до сих пор использовалось недостаточно мелков. Краткое иллюстрированное резюме появляется в конце.
Ученик : Что означает р-значение? Многие люди, похоже, согласны с тем, что мы «увидим, что среднее значение выборки больше или равно» статистике или это «вероятность наблюдения этого результата ... учитывая, что нулевая гипотеза верна» или где «статистика моей выборки» упал на [смоделированное] распределение " и даже " вероятность наблюдения тестовой статистики, по крайней мере, такой же, как та, которая рассчитывается при условии, что нулевая гипотеза верна " .
Учитель : При правильном понимании все эти утверждения верны во многих обстоятельствах.
Студент : я не понимаю, насколько они актуальны. Разве вы не учили нас, что мы должны сформулировать нулевую гипотезу и альтернативную гипотезу H A ? Как они вовлечены в эти идеи "больше или равно" или "по крайней мере, настолько большие" или очень популярные "более экстремальные"?H0HA
Учитель : Поскольку это может показаться сложным в целом, поможет ли это нам исследовать конкретный пример?
Студент : Конечно. Но, пожалуйста, сделайте это реалистичным, но простым, если можете.
Учитель : Эта теория проверки гипотез исторически началась с необходимости астрономов анализировать ошибки наблюдений, так что как насчет того, чтобы начать там? Однажды я просматривал некоторые старые документы, где ученый описал свои усилия по уменьшению погрешности измерения в своем приборе. Он провел много измерений звезды в известном положении и записал их смещения до или после этого положения. Чтобы визуализировать эти смещения, он нарисовал гистограмму, которая - при небольшом сглаживании - выглядела так.
Ученик : Я помню, как работают гистограммы: вертикальная ось помечена как «Плотность», чтобы напомнить мне, что относительные частоты измерений представлены областью, а не высотой.
Учитель : Это верно. «Необычное» или «экстремальное» значение будет находиться в регионе с довольно небольшой площадью. Вот мелок. Как вы думаете, вы могли бы раскрасить в регионе, площадь которого составляет только одну десятую от общего числа?
Студент : Конечно; это просто. [Цвета на рисунке.]
Учитель : очень хорошо! Для меня это примерно 10% площади. Помните, однако, что единственные области на гистограмме, которые имеют значение, это те, которые находятся между вертикальными линиями: они представляют вероятность или вероятность того, что смещение будет находиться между этими линиями на горизонтальной оси. Это означает, что вам нужно раскрасить все до дна, и это будет больше половины площади, не так ли?
Студент : О, я вижу. Дай мне попробовать снова. Я хочу раскрасить там, где кривая действительно низкая, не так ли? Это самый низкий на двух концах. Нужно ли раскрашивать только в одной области или можно разбить ее на несколько частей?
Учитель : Использование нескольких частей - умная идея. Где бы они были?
Студент (указывая): здесь и здесь. Поскольку этот карандаш не очень острый, я использовал ручку, чтобы показать вам линии, которые я использую.
0.10.1
Студент : это очень плохо. Но разве это не намного лучше, чем широкое распространение смещений в вашей фигуре?
H0
0.1
Учитель : Продолжай, у тебя все хорошо.
Ученик : И альтернатива в том, что новые измерения будут менее распространены, верно?
Учитель : очень хорошо! Не могли бы вы нарисовать мне картину того, как будет выглядеть гистограмма с меньшим разбросом? Вот еще одна копия первой гистограммы; Вы можете нарисовать поверх него в качестве ссылки.
Ученик (рисует): я использую ручку, чтобы наметить новую гистограмму, и я закрашиваю область под ней. Я сделал так, чтобы большая часть кривой была близка к нулю на горизонтальной оси, и поэтому большая часть ее области близка к (горизонтальному) значению нуля: вот что значит быть менее развернутым или более точным.
11
Студент : Думаю, меньше половины. Я вижу, что это проблема, но я не знаю, как это исправить. Что я должен делать?
1
Ученик : Понятно: вы вытянули его вертикально, чтобы его форма на самом деле не изменилась, но теперь красная область и серая область (включая часть под красным) равны.
Учитель : Верно. Вы смотрите на картину нулевой гипотезы (синим цветом, разбросаны) и части альтернативной гипотезы (красным цветом, с меньшим разбросом).
Студент : Что вы подразумеваете под «частью» альтернативы? Разве это не альтернативная гипотеза?
Учитель : статистика и грамматика, похоже, не смешиваются. :-) Серьезно, то, что они подразумевают под «гипотезой», обычно представляет собой целый большой набор возможностей. Здесь альтернатива (как вы уже говорили ранее) состоит в том, что измерения «менее разбросаны», чем раньше. Но насколько меньше ? Есть много возможностей. Здесь, позвольте мне показать вам еще один. Я нарисовал его желтыми черточками. Это между предыдущими двумя.
Ученик : Понятно: у вас может быть разное количество спреда, но вы не знаете заранее, насколько спред будет на самом деле. Но почему вы сделали смешную штриховку на этой картинке?
Учитель : Я хотел бы подчеркнуть, где и как отличаются гистограммы. Я заштриховал их серым цветом, где альтернативные гистограммы ниже нуля, и красным, где альтернативы выше .
Студент : Почему это имеет значение?
Учитель : Вы помните, как вы раскрасили первую гистограмму в обоих хвостах? [Просматривая документы.] Ах, вот оно. Давайте раскрасим эту картинку таким же образом.
Студент : Я помню: это крайние ценности. Я нашел места, где нулевая плотность была как можно меньше и окрашена в 10% площади.
Учитель : Расскажите мне об альтернативах в этих экстремальных областях.
Ученик : Трудно увидеть, потому что карандаш скрыл это, но похоже, что у альтернативы почти нет шансов оказаться в областях, которые я раскрасил. Их гистограммы направлены прямо против оси значений, и под ними нет места.
−2
−2
0.1
0.1
0.100.2
00.2
Учитель : Вам не нужно заходить так далеко. Вы можете просто сказать, какой район является самым большим?
0.1
Учитель : Вы хорошо разбираетесь в моделях, поэтому скажите мне: как измерительный прибор становится все более и более точным, что происходит с его гистограммой?
03/4
11
Учитель (продолжает): Не могли бы вы показать мне, где альтернативы, как правило, более вероятны, чем нулевые?
Студент (раскраска): Здесь, в середине, очевидно. И поскольку это больше не гистограммы, я думаю, что мы должны смотреть на высоты, а не на области, поэтому я просто отмечаю диапазон значений на горизонтальной оси. Но как я узнаю, сколько в середине цвета? Где я могу перестать красить?
Учитель : Там нет твердого правила. Все зависит от того, как мы планируем использовать наши выводы и насколько яростны скептики. Но сидеть сложа руки и думать о том, что вы сделали: теперь вы понимаете , что результаты с большим отношением правдоподобий являются доказательством для альтернативы и результаты с небольшими отношениями правдоподобий свидетельствуют против альтернативы. Что я попрошу вас сделать, так это раскрасить область, которая, насколько это возможно, имеет малую вероятность появления при нулевой гипотезе и относительно большую вероятность появления при альтернативах. Возвращаясь к первой раскрашенной вами диаграмме, еще в начале нашего разговора вы раскрасили два нулевых хвоста, потому что они были «экстремальными». Будут ли они делать хорошую работу?
3.03.0
Учитель : Что это представляет?
Ученик : Мы начали с того, что вы попросили меня нарисовать всего 10% площади под исходной гистограммой - той, которая описывает ноль. Так что теперь я нарисовал 10% области, где альтернативы кажутся более вероятными. Я думаю, что когда новое измерение в этой области, это говорит нам, что мы должны верить альтернативе.
Учитель : А как скептик должен реагировать на это?
Студент : Скептик никогда не должен признать, что он не прав, не так ли? Но я думаю, что его вера должна быть немного поколеблена. В конце концов, мы организовали его так, чтобы, хотя измерение могло быть внутри области, которую я только что нарисовал, оно имеет 10% -ный шанс быть там, когда значение равно нулю. И у него больше шансов быть там, когда альтернатива верна. Я просто не могу сказать вам, насколько больше этот шанс, потому что это будет зависеть от того, насколько ученый усовершенствовал аппарат. Я просто знаю, что это больше. Так что доказательства будут против скептика.
Учитель : Хорошо. Не могли бы вы подвести итог своему пониманию, чтобы нам было совершенно ясно, что вы узнали?
Студент : я узнал, что для сравнения альтернативных гипотез с нулевыми гипотезами мы должны сравнить их гистограммы. Мы делим плотности альтернатив на плотность нуля: это то, что вы назвали «отношением правдоподобия». Чтобы сделать хороший тест, я должен выбрать небольшое число, например 10%, или что-то еще, что может потрясти скептика. Затем я должен найти значения, в которых отношение правдоподобия максимально возможно, и раскрасить их до тех пор, пока 10% (или что-то еще) не будет окрашено.
Учитель : А как бы вы использовали эту раскраску?
Ученик : Как вы напомнили ранее, раскраска должна быть между вертикальными линиями. Значения (на горизонтальной оси), лежащие под окраской, свидетельствуют о нулевой гипотезе. Другие значения - ну, трудно сказать, что они могут значить, не рассматривая все гистограммы более подробно.
0.1
Студент : Это в той области, где я последний раз красился, так что я думаю, что ученый, вероятно, был прав, и аппарат действительно был улучшен.
Учитель : И последнее. Ваш вывод основывался на выборе 10% в качестве критерия или «размера» теста. Многие люди предпочитают использовать 5% вместо этого. Некоторые предпочитают 1%. Что вы могли бы им сказать?
00.10.050.10.080.1, Они не пришли бы к такому же выводу, как я: они сказали бы, что недостаточно доказательств того, что изменение действительно произошло.
0.08
Студент : Спасибо. Я не уверен, что я полностью все это понимаю, но вы дали мне много думать.
Учитель : Если вы хотите пойти дальше, взгляните на лемму Неймана-Пирсона . Вы, вероятно, готовы понять это сейчас.
конспект
ztt=0.1
0t=0.1достигнуто Значение p - это область затененной области под нулевой гистограммой: это шанс, если нулевое значение истинно, наблюдать результат, отношения вероятности которого, как правило, велики независимо от того, какая альтернатива оказывается истинной. В частности, эта конструкция тесно связана с альтернативной гипотезой. Это не может быть выполнено без указания возможных альтернатив.