Как Лассо масштабируется с размером матрицы дизайна?


10

Если у меня есть проектная матрица , где - число наблюдений измерения , какова сложность решения для с LASSO, без и ? Я думаю, что ответ должен относиться к тому, как масштабируется одна итерация LASSO с этими параметрами, а не к тому, как масштабируется количество итераций (сходимость), если вы не чувствуете иначе. п d β = argmin β 1XRn×dndндβ^=argminβ12n||Xβy||2+λ||β||1nd

Я читал этот предыдущий вопрос о сложности LASSO , но он, кажется, расходится с обсуждением glmnet здесь и здесь . Я знаю, что существует множество алгоритмов, включая подход GLMnet для GLMnet, но я пишу статью о замене компонента LASSO на родительский алгоритм и хотел бы включить обсуждение сложности LASSO в целом, особенно с и . Я также хотел бы знать сложность glmnet в базовом не разреженном случае, но упомянутая статья немного сбивает с толку, поскольку вся сложность алгоритма не является явной.нdn


3
Непонятно, почему этот ответ stats.stackexchange.com/a/190717/28666 (в ветке, на которую вы ссылались ) не отвечает на ваш вопрос. Можете ли вы уточнить? Что расходится с чем?
амеба

Страница 6 в [pdf] [1] гласит: «Таким образом, полный цикл по всем d переменным стоит ». Однако вопрос вы связываете с состояниями O ( d 2 n ) . Я пропускаю цикл, чтобы получить сложность d 2 ? [1]: jstatsoft.org/article/view/v033i01O(dn)O(d2n)d2
rnoodle

@amoeba Ссылка, которую вы предоставляете для алгоритма LARS - я хочу знать о подходе GLM.
rnoodle

Ссылки, для наименьшей угловой регрессии и O ( d n ) для координатного спуска, верны. Разница в том, что (1) LARS находит точное решение в O ( d 2 n ) (и делает это, пересекая весь путь возможного λ со сложностью, равной задаче OLS, ко всей задаче, которая также масштабируется как O ( d). 2 n ) ), в то время как (2) спуск координат делает «только» один шаг аппроксимации в O ( dO(d2n)O(dn)O(d2n)λO(d2n) , сходясь / «спускаясь» ближе к минимуму задачи LASSO. LARS использует d шагов. С координатным спуском ... никто не знает. O(dn)d
Секст Эмпирик

Ответы:


3

Ответы из ссылок,

  • для регрессии наименьшего углаО(d2N)
  • для координатного спускаО(dN)

, верны.


Разница в том, что

Уравнения ЛАРС пишутся в замкнутом виде и находят точное решение

О(d2N)

пока

О(dN)


dО((d-К)N+К2)d-КК

d2Nddd>>100dзнак равно100


Масштабирование LARS - это проблема сложности вычислений. Масштабирование спуска координат является проблемой, связанной с вычислительной сложностью и сходимостью.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.