Имеет ли смысл проводить односторонний тест Колмогорова-Смирнова?


15

Имеет ли смысл и возможно ли выполнить односторонний тест KS? Какой будет нулевая гипотеза такого теста? Или тест KS по своей сути является двусторонним тестом?

Мне был бы полезен ответ, который помог мне понять распределение D (я работаю через статью Масси 1951 года и нахожу описание сложным, например, и - супремум и инфимум различий не абсолютной величины различий в эмпирических CDF?).D+D

Дополнительный вопрос: как получают для и ? Так много публикаций, с которыми я сталкиваюсь, представляют табличные значения, а не CDF , и .pD+DDnD+D

Обновление: я только что обнаружил связанный вопрос Что является нулевой гипотезой в одностороннем тесте Колмогорова-Смирнова? , который я пропустил на моем первоначальном сканировании, прежде чем написать этот.

Ответы:


20

Имеет ли смысл и возможно ли выполнить односторонний тест KS?

Определенно.

Является ли тест KS по своей сути двусторонним тестом?

Не за что.

Какой будет нулевая гипотеза такого теста?

Вы не даете понять, говорите ли вы об одном или двух образцах теста. Мой ответ здесь охватывает оба - если вы рассматриваете как представление cdf популяции, из которой была взята выборка X , это две выборки, в то время как вы получаете случай одной выборки, рассматривая F X как некоторое предполагаемое распределение ( F 0 , Если вы предпочитаете).FXXFXF0

В некоторых случаях вы могли бы записать ноль как равенство (например, если он не видел возможности для него пойти другим путем), но если вы хотите написать направленные нули для односторонней альтернативы, вы можете написать что-то вроде этого :

H0:FY(t)FX(t)

H1:FY(t)<FX(t)хотя бы для одного t

(или наоборот для другого хвоста, естественно)

Если при использовании теста мы добавим предположение, что они равны или что будет меньше, то отклонение нуля подразумевает (первый порядок) стохастический порядок / первый порядокFY стохастическое доминирование . В достаточно больших выборках возможно пересечение F - даже несколько раз, и все же отклонение одностороннего теста, поэтому строгое предположение необходимо для сохранения стохастического доминирования.

Проще говоря, если со строгим неравенством по крайней мере для некоторого t, то Y «имеет тенденцию быть больше», чем XFY(t)FX(t)tYX .

Добавление таких предположений не странно; это стандарт. Это не особенно отличается от предположения (скажем, в ANOVA), что различие в средствах происходит из-за смещения всего распределения (а не из-за изменения асимметрии, когда часть распределения смещается вниз, а часть смещается вверх, но в таком Кстати, что значит изменилось).


Итак, давайте рассмотрим, например, изменение среднего значения для нормали:

введите описание изображения здесь

Тот факт, что распределение для смещено вправо на некоторое количество от распределения для X, означает, что F Y ниже, чем F XYXFYFX . Односторонний критерий Колмогорова-Смирнова в этой ситуации будет отклоняться.

Точно так же рассмотрим масштабный сдвиг в гамме:

введите описание изображения здесь

Опять же, сдвиг в большем масштабе приводит к снижению F. Опять же, односторонний критерий Колмогорова-Смирнова будет отклоняться в этой ситуации.

Существует множество ситуаций, когда такой тест может быть полезен.


Так что же такое и D - ?D+D

В тесте с одной выборкой - это максимальное положительное отклонение образца cdf от предполагаемой кривой (это наибольшее расстояние, на котором ECDF выше F 0 , а D - максимальное отрицательное отклонение - наибольшее расстояние, на котором ECDF ниже F 0 ). И D +, и D - являются положительными величинами:D+F0DF0D+D

введите описание изображения здесь

D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t)t

YFF0DFY(t)<F0(t)D


D+D

Это не простая вещь. Есть множество подходов, которые были использованы.

Если я правильно помню, один из способов распределения был получен с помощью процессов броуновского моста ( этот документ, кажется, поддерживает это воспоминание ).

Я полагаю, что эта статья, а также статья Marsaglia и др. Здесь охватывают некоторые предпосылки и дают вычислительные алгоритмы с большим количеством ссылок.

Между ними вы получите много истории и различные подходы, которые были использованы. Если они не охватывают то, что вам нужно, вам, вероятно, придется задать это как новый вопрос.

DnD+D

Это не особенно удивительно. Если я правильно помню, даже асимптотическое распределение получается как ряд (это воспоминание было бы неправильно), а в конечных выборках оно дискретно и не в какой-либо простой форме. В любом случае и нет удобного способа представить информацию, кроме как в виде графика или таблицы.


2
«В достаточно больших выборках для F возможно пересечение - даже несколько раз, и все же отклонение одностороннего теста» - обратите внимание, что это означает, что вы можете отклонить односторонний тест в обоих направлениях для одних и тех же данных!
Хао Йе

2
@HaoYe Да, это возможно. Это было бы четким признаком того, что стохастическое доминирование было бы несостоятельным.
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.