Зачем нам вообще нужна альтернативная гипотеза?
В классическом тесте гипотезы единственная математическая роль, которую играет альтернативная гипотеза, состоит в том, что она влияет на упорядоченность доказательств через выбранную статистику теста. Альтернативная гипотеза используется для определения соответствующей статистики теста для теста, которая эквивалентна установке порядкового ранжирования всех возможных результатов данных от тех, которые наиболее благоприятны для нулевой гипотезы (против заявленной альтернативы), к тем, которые наименее благоприятны для нулевых гипотез (против заявленной альтернативы). После того, как вы сформировали этот порядковый рейтинг возможных результатов данных, альтернативная гипотеза больше не играет никакой математической роли в тесте .
nx=(x1,...,xn)T:Rn→Rэто отображает каждый возможный результат данных в порядковом масштабе, который измеряет, является ли это более благоприятным для нулевой или альтернативной гипотезы. (Без ограничения общности мы будем предполагать, что более низкие значения более благоприятны для нулевой гипотезы, а более высокие значения более благоприятны для альтернативной гипотезы. Иногда мы говорим, что более высокие значения тестовой статистики являются «более экстремальными», поскольку они составляют более экстремальные доказательства альтернативной гипотезы.) Тогда значение p теста определяется как:
p(x)≡pT(x)≡P(T(X)⩾T(x)|H0).
Эта функция p-значения полностью определяет свидетельство в тесте для любого вектора данных. В сочетании с выбранным уровнем значимости он определяет результат теста для любого вектора данных. (Мы описали это для фиксированного числа точек данных но это можно легко расширить, чтобы учесть произвольное .) Важно отметить, что на значение p влияет тестовая статистика только через порядковый масштаб, который она вызываетnn, поэтому, если вы применяете монотонно возрастающее преобразование к статистике теста, это не имеет значения для теста гипотезы (т. е. это тот же тест). Это математическое свойство просто отражает тот факт, что единственная цель тестовой статистики состоит в том, чтобы индуцировать порядковый масштаб в пространстве всех возможных векторов данных, чтобы показать, какие из них более благоприятны для нулевой / альтернативной.
Альтернативная гипотеза влияет на это измерение только через функциюT , которая выбирается на основе заявленной нулевой и альтернативной гипотез в рамках общей модели. Следовательно, мы можем рассматривать тестовую статистическую функцию как функцию общей модели и двух гипотез. Например, для теста отношения правдоподобия тестовая статистика формируется путем взятия отношения (или логарифма отношения) супремумов функции правдоподобия в диапазонах параметров, относящихся к нулевой и альтернативной гипотезам.T≡g(M,H0,HA)M
Что это значит, если мы сравниваем тесты с разными альтернативами? Предположим, у вас есть фиксированная модель и вы хотите провести два разных теста гипотез, сравнивающих одну и ту же нулевую гипотезу с двумя разными альтернативами и . В этом случае у вас будет две разные функции статистики теста:MH0HAH′A
T=g(M,H0,HA)T′=g(M,H0,H′A),
приводя к соответствующим функциям p-значения:
p(x)=P(T(X)⩾T(x)|H0)p′(x)=P(T′(X)⩾T′(x)|H0).
Важно отметить, что если и являются монотонными возрастающими преобразованиями друг друга, то функции p-значения и идентичны, поэтому оба теста являются одним и тем же тестом. Если функции и не являются монотонными возрастающими преобразованиями друг друга, то у нас есть два действительно разных теста гипотез.TT′pp′TT′