Как я могу адаптировать ANOVA для двоичных данных?


11

У меня есть четыре конкурирующих модели, которые я использую, чтобы предсказать бинарную переменную результата (скажем, статус занятости после окончания, 1 = занятый, 0 = не занятый) для n предметов. Естественным показателем производительности модели является коэффициент попадания, который представляет собой процент правильных прогнозов для каждой из моделей.

Мне кажется, что я не могу использовать ANOVA в этой настройке, поскольку данные нарушают предположения, лежащие в основе ANOVA. Есть ли эквивалентная процедура, которую я мог бы использовать вместо ANOVA в приведенной выше настройке, чтобы проверить гипотезу о том, что все четыре модели одинаково эффективны?

Ответы:


6

Таблица непредвиденных расходов (хи-квадрат). Также Логистическая регрессия - ваш друг - используйте фиктивные переменные.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.