Есть ли альтернатива критерию Колмогорова-Смирнова для связанных данных с коррекцией?


14

У меня есть набор данных из двух выборок (контрольной и обработанной), каждая из которых содержит несколько тысяч значений, которые должны пройти проверку на значимость в R. Теоретически значения должны быть непрерывными, но из-за округления, выполняемого программным обеспечением для измерения, они не ' и у них есть связи. Распределения неизвестны, а формы контрольных и обработанных распределений могут отличаться, поэтому я бы хотел использовать непараметрический тест для сравнения, если разница между выборками значительна для 10 различных факторов.

Я думал об использовании теста Колмогорова-Смирнова, но он не очень подходит для галстуков. Недавно я наткнулся на новую библиотеку R под названием Matching, которая выполняет загрузочную версию теста KS и допускает связи. Теперь это действительно хорошая идея или я должен использовать другой тест вместо этого? И нужно ли мне корректировать значение p?


Связанный документ имеет дело с сопоставлением оценки склонности. Может быть, у теста начальной загрузки есть больше общего, но я не уверен.
Майкл Р. Черник

Я бы сделал рандомизированную версию чего-то вроде Колмогорова-Смирнова (ну, на самом деле, я бы, наверное, использовал Андерсона-Дарлинга или Крамер-фон Мизеса для КС, но все же с распределением рандомизации, чтобы позаботиться связей).
Glen_b

Ответы:


13

Вместо использования теста KS вы можете просто использовать процедуру перестановки или повторной выборки, как это реализовано в oneway_testфункции coinпакета. Посмотрите на принятый ответ на этот вопрос .

Обновление : Мой пакет afexсодержит функцию, compare.2.vectorsреализующую перестановку и другие тесты для двух векторов. Вы можете получить его из CRAN:

install.packages("afex")

Для двух векторов xи yон (в настоящее время) возвращает что-то вроде:

> compare.2.vectors(x,y)
$parametric
   test test.statistic test.value test.df       p
1     t              t     -1.861   18.00 0.07919
2 Welch              t     -1.861   17.78 0.07939

$nonparametric
             test test.statistic test.value test.df       p
1 stats::Wilcoxon              W     25.500      NA 0.06933
2     permutation              Z     -1.751      NA 0.08154
3  coin::Wilcoxon              Z     -1.854      NA 0.06487
4          median              Z      1.744      NA 0.17867

Любые комментарии относительно этой функции приветствуются.


3
(+1) Описание этого и других тестов можно найти в этом блоге

@Henrik Спасибо за предложение и за указание на другой вопрос. Это действительно полезно!
AnjaM

@AnjaM Добро пожаловать. Вы также можете проверить мое обновление.
Хенрик
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.