Регрессия LASSO сокращает коэффициенты до нуля, тем самым обеспечивая эффективный выбор модели. Я считаю, что в моих данных есть значимые взаимодействия между номинальными и непрерывными ковариатами. Однако не обязательно, чтобы «основные эффекты» истинной модели были значимыми (отличными от нуля). Конечно, я не знаю этого, поскольку истинная модель неизвестна. Мои цели - найти истинную модель и максимально точно предсказать результат.
Я узнал, что классический подход к построению модели всегда будет включать основной эффект, прежде чем будет включено взаимодействие. Таким образом, не может быть модели без основного эффекта двух ковариат и если в той же модели существует взаимодействие ковариатСледовательно, функция тщательно выбирает термины модели (например, основанные на обратной или прямой AIC), соблюдая это правило.step
R
LASSO, кажется, работает по-другому. Поскольку все параметры штрафуются, без сомнения, может случиться так, что основной эффект будет уменьшен до нуля, тогда как взаимодействие лучшей (например, перекрестной проверки) модели не равно нулю. Это я считаю , в частности , для моих данных при использовании R
«s glmnet
пакет.
Я получил критику на основании первого правила, приведенного выше, т.е. моя окончательная перекрестная проверка модели Лассо не включает соответствующие члены основного эффекта некоторого ненулевого взаимодействия. Однако это правило кажется несколько странным в этом контексте. То, к чему это сводится, является вопросом, является ли параметр в истинной модели нулевым. Предположим, что это не так, но взаимодействие ненулевое, тогда LASSO, возможно, определит это, найдя правильную модель. На самом деле, кажется, что прогнозы из этой модели будут более точными, потому что модель не содержит основного эффекта истинного нуля, который фактически является переменной шума.
Могу ли я опровергнуть критику, основанную на этом основании, или я должен как-то предупредить, что LASSO включает основной эффект перед термином взаимодействия?