Боюсь, что связанные вопросы не ответили на мои. Мы оцениваем показатели> 2 классификаторов (машинное обучение). Наша нулевая гипотеза состоит в том, что показатели не отличаются. Мы проводим параметрический (ANOVA) и непараметрический (Friedman) тесты, чтобы оценить эту гипотезу. Если они важны, мы хотим выяснить, какие классификаторы отличаются в заданном квесте.
Мой вопрос двоякий:
1) Нужна ли вообще коррекция p-значений после многократного сравнения? Сайт немецкой Википедии на «Alphafehler Kumulierung» говорит, что проблема возникает, только если несколько гипотез проверяются на одних и тех же данных. При сравнении классификаторов (1,2), (1,3), (2,3) данные только частично перекрываются. Требуется ли исправить значения p?
2) Коррекция P-значения часто используется после попарного тестирования с помощью t-критерия. Это также необходимо при проведении специальных специальных тестов, таких как тест Немени (непараметрический) или тест Тьюки HSD? Этот ответ говорит «нет» для HSD Тьюки: корректен ли тест Tukey HSD для множественных сравнений? , Есть ли правило, или я должен искать это для каждого потенциального пост-специального теста?
Благодаря!