Наказанные модели могут использоваться для оценки моделей, в которых количество параметров равно или даже превышает размер выборки. Такая ситуация может возникнуть в лог-линейных моделях больших разреженных таблиц категориальных данных или данных подсчета. В этих настройках часто также желательно или полезно сворачивать таблицы, комбинируя уровни фактора, где эти уровни не различимы с точки зрения их взаимодействия с другими факторами. Два вопроса:
- Есть ли способ использовать оштрафованные модели, такие как LASSO или эластичная сетка, для проверки способности уровней к каждому фактору?
- Если ответ на первый вопрос - да, можно и нужно ли это настроить таким образом, чтобы коллапс уровней и оценка коэффициентов модели происходили за один шаг?