Что такое лассо в регрессионном анализе?


Ответы:


112

LASSO (оператор наименьшей абсолютной усадки и выбора) - это метод регрессии, который предусматривает штрафование абсолютного размера коэффициентов регрессии.

Наказывая (или эквивалентно ограничивая сумму абсолютных значений оценок), вы попадаете в ситуацию, когда некоторые оценки параметров могут быть точно равны нулю. Чем больше примененное наказание, тем ниже оценки сокращаются до нуля.

Это удобно, когда нам нужен автоматический выбор объекта / переменной, или когда мы имеем дело с сильно коррелированными предикторами, где стандартная регрессия обычно имеет слишком большие коэффициенты регрессии.

https://web.stanford.edu/~hastie/ElemStatLearn/ (бесплатная загрузка) содержит подробное описание LASSO и связанных с ним методов.


Я новичок на сайте; это именно та информация, которую я искал; большое спасибо.
Пол Фогт

Есть ли PDF-файл о том, как решить эту проблему, используя двойную задачу?
Рой

Ссылка не работает
Оливер Анжелил

3

Регрессия LASSO - это тип регрессионного анализа, в котором выбор переменных и регулирование происходят одновременно. Этот метод использует штраф, который влияет на их значение коэффициентов регрессии. По мере увеличения штрафа большее количество коэффициентов становится равным нулю, и наоборот. Он использует технику нормализации L1, в которой параметр настройки используется в качестве величины усадки. При увеличении параметра настройки смещение увеличивается, а если уменьшается, дисперсия увеличивается. Если она постоянна, то никакие коэффициенты не равны нулю и, как правило, стремятся к бесконечности, тогда все коэффициенты будут нулевыми


2

В «нормальной» регрессии (OLS) цель состоит в том, чтобы минимизировать остаточную сумму квадратов (RSS) для оценки коэффициентов

argminβRpi=1n(Yij=1pXijβj)2

В случае регрессии LASSO вы оцениваете коэффициенты с немного другим подходом:

argminβRpi=1n(Yij=1pXijβj)2+λj=1p|βj|

λλ

λ=0argminλ=1λчем больше штраф применяется к коэффициентам, и чем меньше будут коэффициенты, то некоторые могут стать равными нулю. Это означает, что LASSO может привести к экономным моделям путем выбора функции, и это предотвращает переоснащение модели. Тем не менее, вы можете использовать LASSO, если у вас много функций, и ваша цель - скорее прогнозировать данные, чем интерпретировать коэффициенты вашей модели.


1
TEXTEX

@Tim: Большое спасибо за это! Это был отличный совет, чтобы нажать кнопку редактирования, чтобы увидеть, как это делается.
валун
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.