Для LASSO (и других процедур выбора модели) важно изменить масштаб предикторов. Общая рекомендация я следую просто использовать 0, 1 среднее стандартное отклонение нормализации для непрерывных переменных. Но что тут делать с чайниками?
Например, некоторые прикладные примеры из той же (отличной) летней школы, которую я связал с масштабированием непрерывных переменных, должны быть между 0 и 1 (хотя и не слишком хорошими для выбросов), вероятно, чтобы быть сопоставимыми с манекенами. Но даже это не гарантирует, что коэффициенты должны быть одинакового порядка и, следовательно, наказываться аналогичным образом, что является основной причиной для масштабирования, нет?