Этот пост следует за этим: Почему оценка гребня становится лучше, чем OLS, добавляя константу к диагонали?
Вот мой вопрос:
Насколько я знаю, в регуляризации хребта используется (евклидово расстояние). Но почему мы используем квадрат этой нормы? (прямое применение приведет к получению квадратного корня от суммы квадрата бета).ℓ 2
Для сравнения, мы не делаем этого для LASSO, который использует для регуляризации. Но здесь это «реальная» норма (просто сумма квадрата абсолютных значений бета, а не квадрат этой суммы).ℓ 1
Может кто-нибудь помочь мне уточнить?