Извините, если этот вопрос встречается немного базовым.
Я хочу использовать выбор переменных LASSO для модели множественной линейной регрессии в R. У меня есть 15 предикторов, один из которых является категориальным (вызовет ли это проблему?). После установки моих и я использую следующие команды:
model = lars(x, y)
coef(model)
Моя проблема, когда я использую coef(model)
. Это возвращает матрицу с 15 строками, каждый раз добавляется один дополнительный предиктор. Однако нет никаких предложений относительно того, какую модель выбрать. Я что-то пропустил? Есть ли способ получить пакет lars для возврата только одной « лучшей » модели?
Есть другие посты, предлагающие использовать glmnet
вместо этого, но это кажется более сложным. Попытка заключается в следующем, используя те же и . Я что-то здесь пропустил?
cv = cv.glmnet(x, y)
model = glmnet(x, y, type.gaussian="covariance", lambda=cv$lambda.min)
predict(model, type="coefficients")
Последняя команда возвращает список моих переменных, большинство с коэффициентом, хотя некоторые из них = 0. Это правильный выбор « лучшей » модели, выбранной LASSO? Если я затем подгоняю линейную модель ко всем моим переменным с коэффициентами, not=0
я получаю очень похожие, но немного отличающиеся оценки коэффициентов. Есть ли причина для такой разницы? Было бы приемлемо перефразировать линейную модель с этими переменными, выбранными LASSO, и принять это как мою окончательную модель? В противном случае я не вижу никаких значений p для значимости. Я что-то пропустил?
Имеет ли
type.gaussian="covariance"
убедиться, что glmnet
используется множественная линейная регрессия?
Влияет ли автоматическая нормализация переменных на коэффициенты вообще? Есть ли способ включить условия взаимодействия в процедуру LASSO?
Я собираюсь использовать эту процедуру в большей степени как демонстрацию того, как LASSO может использоваться, чем для любой модели, которая будет фактически использоваться для любого важного вывода / прогноза, если это что-то изменит.
Спасибо, что нашли время, чтобы прочитать это. Любые общие комментарии по LASSO / lars / glmnet также будут высоко оценены.