Пусть (размер п × р ) обозначает набор стандартных входов, у (размера п × 1 ) с центром ответов, & beta ; (размером р × 1 ) весовые коэффициенты регрессии и Л > 0 л 1 -норм коэффициента Недостатки.Xn×pyn×1βp×1λ>0l1
β∗L(β,λ)=argminβ L(β,λ)=∥y−Xβ∥22+λ∥β∥1
Решение этого для всех значений дает так называемый путь регуляризации LASSO .λ>0β∗(λ)
Для фиксированного значения коэффициента штрафования (т.е. фиксированное число активных предикторов = фиксированный шаг алгоритма LARS) можно показать, что удовлетворяет (просто запишите условие стационарности KKT, как в этом ответь )λ∗β∗
λ∗=2 sign(β∗a)XTa(y−Xβ∗), ∀a∈A
с представляет набор активных предикторов.A
Поскольку должен быть положительным (это коэффициент штрафования), ясно, что знак (вес любого ненулевого, следовательно, активного предиктора) должен быть таким же, как у т.е. корреляция с текущим остатком регрессии.λ∗β∗aXTa(y−Xβ∗)=XTar