Интуиция для степеней свободы LASSO


12

Zou et al. «О« степенях свободы »Лассо» (2007) показывают, что число ненулевых коэффициентов является объективной и непротиворечивой оценкой степеней свободы Лассо.

Это кажется немного нелогичным для меня.

  • Предположим, у нас есть модель регрессии (где переменные имеют среднее значение ноль)

y=βx+ε.
  • Предположим, что неограниченная оценка OLS для равна . Это может примерно совпадать с оценкой LASSO для очень низкой интенсивности штрафа.& beta ; O L S = 0,5 & beta ;ββ^OLS=0.5β
  • Предположим далее, что оценка LASSO для конкретной интенсивности штрафа равна . Например, может быть «оптимальным» для набора данных, найденного с помощью перекрестной проверки. * β L S S O , λ * = 0,4 λ * λλβ^LASSO,λ=0.4λλ
  • Если я правильно понимаю, в обоих случаях степень свободы равна 1, так как оба раза есть один ненулевой коэффициент регрессии.

Вопрос:

  • Почему степени свободы в обоих случаях одинаковы, хотя предполагает меньшую "свободу" подгонки, чем ? β OLS=0,5β^LASSO,λ=0.4β^OLS=0.5

Ссылки:


1
Отличный вопрос, который заслуживает большего внимания!
Матифу

Ответы:


8

Предположим, нам дан набор из -мерных наблюдений: , . Предположим, что модель имеет вид: где , и обозначающие внутреннее произведение. Пусть будет оценкой с использованием метода подгонки (либо OLS, либо LASSO для наших целей). Формула для степеней свободы, приведенная в статье (уравнение 1.2): n pxiRpi=1,,n

Yi=β,xi+ϵ
ϵN(0,σ2)βRp,β^=δ({Yi}i=1n)βδ
df(β^)=i=1nCov(β^,xi,Yi)σ2.

Изучив эту формулу, мы можем предположить, что в соответствии с вашей интуицией истинный DOF для LASSO действительно будет меньше, чем истинный DOF для OLS; коэффициент усадки, вызванный LASSO, должен уменьшать ковариации.

Теперь, чтобы ответить на ваш вопрос, причина того, что DOF для LASSO такой же, как DOF для OLS в вашем примере, заключается просто в том, что вы имеете дело с оценками (хотя и несмещенными), полученными из определенного набора данных, взятого из модели. , из истинных значений DOF. Для любого конкретного набора данных такая оценка не будет равна истинному значению (особенно потому, что оценка должна быть целым числом, в то время как истинное значение вообще является действительным числом).

Однако, когда такие оценки усредняются по многим наборам данных, отобранным из модели, по беспристрастности и закону больших чисел такое среднее будет сходиться к истинному DOF. В случае LASSO некоторые из этих наборов данных приведут к оценке, в которой коэффициент фактически равен 0 (хотя такие наборы данных могут быть редкими, если мала). В случае OLS оценка DOF - это всегда число коэффициентов, а не количество ненулевых коэффициентов, и поэтому среднее значение для случая OLS не будет содержать эти нули. Это показывает, как отличаются оценки и как средняя оценка для LASSO DOF может сходиться к чему-то меньшему, чем средняя оценка для OLS DOF.λ


1
Спасибо за исправление моих ошибок и неточные формулировки. Дай посмотреть, хорошо ли я тебя понял. По сути, если бы нам пришлось повторить эксперимент много раз (или сделать многократную выборку из одной и той же группы населения), мы бы иногда получали (коэффициент уменьшался бы до нуля) и в среднем (через эксперименты) Я бы получил DoF для LASSO то время как DoF для OLS (очевидно). <1=1β^LASSO=0<1=1
Ричард Харди

Кстати, почему оценки степеней свободы должны быть целочисленными? Это правда? Позвольте мне также отметить, что внутренняя запись продукта выглядит излишне сложной и редко используется на этом сайте; матричной записи будет достаточно. Но это твой выбор, конечно.
Ричард Харди

1
Да, это о суммах. Оценка степеней свободы должна быть целым числом для LASSO (по крайней мере, для одного набора данных) только потому, что оценка - это число ненулевых коэффициентов.
e2crawfo

1
Утверждение Оценка степеней свободы должна быть целым числом для LASSO только потому, что оценка количества ненулевых коэффициентов кажется мне очень тавтологической. В общем, я не думаю, что df должен быть целым числом из самого определения df, которое вы написали. Точно так же в случае гребня это не обязательно ноль.
Матифу
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.