У меня есть набор данных из двух выборок (контрольной и обработанной), каждая из которых содержит несколько тысяч значений, которые должны пройти проверку на значимость в R. Теоретически значения должны быть непрерывными, но из-за округления, выполняемого программным обеспечением для измерения, они не ' и у них есть связи. Распределения неизвестны, а формы контрольных и обработанных распределений могут отличаться, поэтому я бы хотел использовать непараметрический тест для сравнения, если разница между выборками значительна для 10 различных факторов.
Я думал об использовании теста Колмогорова-Смирнова, но он не очень подходит для галстуков. Недавно я наткнулся на новую библиотеку R под названием Matching, которая выполняет загрузочную версию теста KS и допускает связи. Теперь это действительно хорошая идея или я должен использовать другой тест вместо этого? И нужно ли мне корректировать значение p?