Как определить, когда регрессионная модель перегружена?


14

Когда вы выполняете эту работу, осознавая, что вы делаете, у вас появляется чувство, когда вы переоцениваете модель. Во-первых, вы можете отследить тренд или ухудшение скорректированного квадрата R модели. Также можно отследить аналогичное ухудшение значений p коэффициентов регрессии основных переменных.

Но когда вы просто читаете чужое исследование, и у вас нет понимания относительно процесса разработки собственной внутренней модели, как вы можете четко определить, является ли модель более подходящей или нет.


Просто чтобы дать пару идей по этому вопросу, если исследование раскрывает стандартную регрессионную статистику, вы можете сосредоточиться на t stats и p значениях коэффициентов. Если RSquare у модели высокое; но одна или несколько переменных имеют значение stat <2.0; это может быть красный флаг. Кроме того, если знак коэффициентов для некоторых переменных не поддается логике, это, вероятно, еще один красный флаг. Если исследование не раскрывает период задержки для модели, это может быть еще один красный флаг. Надеюсь, у вас будут другие и лучшие идеи.
Симпа

Один из способов - посмотреть, как модель работает с другими (но похожими) данными.
Шейн

Ответы:


15

Перекрестная проверка и регуляризация являются довольно распространенными методами предотвращения переоснащения. Для быстрого ознакомления я бы порекомендовал учебные слайды Эндрю Мура по использованию перекрестной проверки ( зеркало ) - обратите особое внимание на предостережения. Для более подробной информации, безусловно, прочитайте главы 3 и 7 EOSL , которые подробно охватывают тему и связанные с ней вопросы.


2
Ух, спасибо, учебник Эндрю Мура по перекрестной проверке - мирового класса.
Симпа

7

Когда я сам подгоняю модель, я обычно использую информационные критерии во время процесса подбора, такие как AIC или BIC , или, альтернативно, тесты отношения правдоподобия для подбора моделей на основе максимального правдоподобия или F-тест для подбора моделей на основе наименьших квадратов.

Все концептуально похожи в том, что они штрафуют дополнительные параметры. Они устанавливают порог «дополнительной объяснительной силы» для каждого нового параметра, добавляемого в модель. Все они являются формой регуляризации .

Что касается моделей других, я просматриваю раздел методов, чтобы увидеть, используются ли такие методы, а также использовать практические правила, такие как количество наблюдений на параметр - если есть около 5 (или меньше) наблюдений на параметр, я начинаю удивляться.

Всегда помните, что переменная не обязательно должна быть «значимой» в модели, чтобы быть важной. Я могу быть нарушителем и должен быть включен на этой основе, если ваша цель - оценить влияние других переменных.


Спасибо за ссылки на тесты AIC и BIC. Добавляют ли они большую ценность по сравнению с Скорректированным квадратом R, что делает то же самое, штрафуя модели за добавление переменных?
Симпа

1
@Gaeten, Скорректированный R-квадрат будет увеличиваться, когда F-критерий модели «до» и «после» значителен, поэтому они эквивалентны, за исключением того, что обычный расчет скорректированного R-квадрата не возвращает p-значение.
Thylacoleo

1
@Gaeten - AIC и BIC являются более общими, чем F-тесты и скорректированные R-квадраты, которые обычно ограничены моделями, подходящими по методу наименьших квадратов. AIC & BIC можно использовать для любой модели, в которой можно рассчитать вероятность и узнать (или оценить) степени свободы.
Thylacoleo

Тестирование набора переменных не является формой регуляризации (сжатия). А тестирование дает искушение удалить переменные, что никак не связано с уменьшением переобучения.
Фрэнк Харрелл

@FrankHarrell Можете ли вы уточнить этот ваш старый комментарий? Мне кажется, что удаление переменной уменьшило бы переоснащение при прочих равных условиях, поскольку степени свободы, доступной для переобучения, уменьшаются. Я уверен, что мне здесь не хватает нюансов.
Лепидоптерист

5

ВяСмM

P(model m is true|one of the M models is true)wmexp(12BICm)j=1Mwjexp(12BICj)
=11+ΣJмMвесJвесмехр(-12(ВяСJ-ВяСм))

весJвесJзнак равно1

ВяСеяNaL<ВяСJпd

M1+п+(п-1)++(п-d+1)знак равно1+п(п-1)-(п-d)(п-d-1)2

M1+п+(п-1)++(d+1)знак равно1+п(п-1)-d(d-1)2

MВяСJλВяСмзнак равноВяСJ-λ

11+(M-1)ехр(-λ2)

λMM

11+п(п-1)-d(d-1)2ехр(-λ2)

пзнак равно50dзнак равно20λп0

λ>-2Lограмм(2(1-п0)п0[п(п-1)-d(d-1)])

п0знак равно0.9λ>18,28


+1, это действительно умно. Это где-то опубликовано? Есть ли официальная ссылка на это?
gung - Восстановить Монику

@ Gung - почему спасибо. К сожалению, это был ответ «с обратной стороны». Я уверен, что есть проблемы с этим, если бы вы расследовали более подробно.
вероятностная
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.