RMSE (среднеквадратическая ошибка) для логистических моделей


10

У меня есть вопрос относительно правильности использования RMSE (среднеквадратичная ошибка) для сравнения различных логистических моделей. Ответ либо, 0либо 1и прогнозы вероятности между 0- 1?

Применяется ли приведенный ниже способ и для двоичных ответов?

# Using glmnet
require(glmnet)
load(url("https://github.com/cran/glmnet/raw/master    /data/BinomialExample.RData"))
cvfit = cv.glmnet(x, y, family = "binomial", type.measure = "mse")
A <- predict(cvfit, newx = x, s = "lambda.min", type = "response")
RMSE1 <- mean((y - A)^2)
# 0.05816881

# glm
mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
mydata$rank <- factor(mydata$rank)
mylogit <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")
AAA <- predict(mylogit, newdata = mydata, type = "response")
RMSE2 <- mean((mydata$admit - AAA)^2)
# 0.194714

1
В этом случае она называется счет Шиповник см actuaries.org/ASTIN/Colloquia/Hague/Papers/Lo.pdf

Ответы:


14

Чтобы понять, почему «[т] он является ответом 0или 1[но] предсказаниями являются вероятности между 0- 1», вам необходимо понять тип модели, с которой вы работаете. Удалите методы наказания и перекрестную проверку, и вы запускаете базовую логистическую регрессию. Параметры вписываются в логарифмическую шкалу / логистическую шкалу. Это называется «линейным предиктором». (Более подробно об этом может помочь вам прочитать мой ответ здесь: Разница между логит-моделями и пробит-моделями .) Если вы включили значение x и упростили, это значение будет предсказанным естественным логарифмом модели шансов «успеха». ( 1). Если вы возведете в степень это значение, вы получите прогнозные шансы модели«успеха». Чтобы получить прогнозируемую вероятность , вам необходимо преобразовать шансы в вероятность через шансы / (1 + шансы). (Подробнее об этом может помочь вам прочитать мой ответ здесь: Интерпретация простых предсказаний для отношений шансов в логистической регрессии .) Это все еще не приведет вас к предсказанному классу . Чтобы получить это, вам необходимо сравнить прогнозируемую вероятность с некоторым порогом, и, если он меньше порога, предсказать 'fail' ( 0), иначе 'success' ( 1). Наиболее распространенный порог по умолчанию - .5, но это часто не оптимально. predict.glm()Функция R позволит вам использоватьtype="link", который выводит прогнозы в масштабе линейного предиктора (т. е. перед всеми этими преобразованиями выше), но это не поможет вам в этом контексте. Использование type="response"дает вам прогнозируемые вероятности.


Когда вы пытаетесь оценить, насколько хорошо бинарная (например, логистическая) модель регрессии предсказывает ответ, у вас есть несколько вариантов:

  1. Первое и наиболее интуитивно понятное - сравнить прогнозируемый класс с наблюдаемым классом и вычислить правильный процент. Хотя это интуитивно понятно, у него есть проблемы. Отчасти это зависит от оптимальности порога в дополнение к другим аспектам модели, соответствующим образом подходящим. Он также выбрасывает много информации (т. Е. Как далеко от порога прогнозируемой вероятности), что не очень хорошая вещь.
  2. Следующим вариантом будет использование области под кривой «Характеристики работы приемника» (ROC). Большинство людей используют эту опцию; это значительно лучше, чем использование правильного процента. Однако в AUC большинство людей не осознают, что на самом деле они измеряют соответствующий порядок ваших прогнозов, а не их фактическую точность. То есть, если вы предсказали вероятности для четырех наблюдений .2, .4, .6, .8и добавили 0,01 ко всем из них ( .21, .41, .61, .81), AUC будет одинаковым, даже если оба набора предсказанных вероятностей не могут быть одинаково точными.
  3. Третий способ оценки вашей модели - использование правильной функции оценки. Пожалуй, самая популярная функция оценки в вашем контексте - оценка Бриера . Как отмечает @fcoppens, метод в вашем коде - это оценка Бриера. Он будет оценивать не только то, будет ли модель надлежащим образом прогнозировать, что одно наблюдение более вероятно будет «успешным», чем другое наблюдение, но также и то, будет ли предсказанная вероятность модели действительно правильной.

К сожалению, оценка Бриера менее известна и используется. Хотя относительная интуитивность этих методов такова: процент правильных> AUC> показатель Бриера, их истинная информативность противоположна: показатель Бриера> AUC> процент правильных. Если вам нужна только простая мера производительности вашей модели, различие между этими методами менее важно, но если вы хотите использовать эти методы для оптимизации модели или выбора модели, использование низшего метода приведет к снижению производительности. ,


1

Использование RMSE имеет гораздо больше смысла, если ваш термин ошибки нормально распределен со средним нулем, но в двоичных результатах это не так. Поэтому я думаю, что вы должны использовать разные подходы, которые поддаются бинарным результатам, как, например, сравнение различий в вероятности.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.