Я оцениваю эффективность 5 различных методов для прогнозирования конкретного двоичного результата (назовите их «Успех» и «Неудача»). Данные выглядят так:
Method Sample_Size Success Percent_Success
1 28 4 0.14
2 19 4 0.21
3 24 7 0.29
4 21 13 0.61
5 22 9 0.40
Я хотел бы провести тест среди этих 5 методов, чтобы оценить относительное превосходство методов. Другими словами, я хочу упорядочить методы в порядке производительности как метод 1> метод 2> ... метод 5. Чтобы избежать проблемы множественных сравнений, я планирую провести тест перестановки по следующим строкам:
Шаг 1: Объедините все данные так, чтобы общий размер выборки составил 114 с общим 37 успехами.
Шаг 2: Случайно разделить данные на 5 групп с соответствующими размерами выборки 28, 19, 24, 21 и 22.
Шаг 3: Увеличьте счетчик, если наблюдаемый порядок Percent_Success из шага 2 соответствует порядку моих данных.
Шаг 4: Повторите шаги 2 и 3 много раз (скажем, 10000).
Желаемое значение p = Конечное значение счетчика / 10000.
Вопросов:
Вышеописанная процедура в порядке?
Есть ли в R что-нибудь, что позволило бы мне выполнить вышеуказанный тест?
Любые предложения по улучшению или альтернативные методы будут полезны.