Одним из мотивов для эластичной сетки было следующее ограничение LASSO:
В случае лассо выбирает не более n переменных, прежде чем оно насыщается, из-за характера задачи выпуклой оптимизации. Кажется, это ограничивающая особенность метода выбора переменных. Более того, лассо не является четко определенным, если только ограничение на L1-норму коэффициентов не меньше определенного значения.
( http://onlinelibrary.wiley.com/doi/10.1111/j.1467-9868.2005.00503.x/full )
Я понимаю, что LASSO - это проблема квадратичного программирования, но она также может быть решена с помощью LARS или поэлементного градиентного спуска. Но я не понимаю, где в этих алгоритмах я сталкиваюсь с проблемой, если где - число предикторов, а - размер выборки. И почему эта проблема решается с помощью эластичной сети, где я увеличиваю задачу до переменных, которые явно превышают .