Теперь я понимаю, что это зависит от распределения и нормальности в предикторах
преобразование журнала делает данные более однородными
Как общее утверждение, это неверно - но даже если бы это было так, почему однородность была бы важна?
Рассмотрим, например,
i) двоичный предиктор, принимающий только значения 1 и 2. Взятие журналов оставило бы его в качестве двоичного предиктора, принимающего только значения 0 и log 2. Это на самом деле не влияет ни на что, кроме перехвата и масштабирования терминов с участием этого предиктора. Даже р-значение предиктора будет неизменным, как и соответствующие значения.
II) рассмотреть левосторонний предиктор. Теперь возьмите логи. Это обычно становится более левым перекосом.
iii) единообразные данные становятся левосторонними
(хотя часто это не всегда так сильно меняется)
меньше пострадали от выбросов
Как общее утверждение, это неверно. Рассмотрим низкие выбросы в предикторе.
Я думал о преобразовании журнала всех моих непрерывных переменных, которые не представляют особого интереса
Для чего? Если бы изначально отношения были линейными, они бы больше не были.
И если они уже изогнуты, автоматическое выполнение этого может сделать их хуже (более изогнутыми), а не лучше.
-
Иногда может подойти регистрация логов предиктора (будь то первичный интерес или нет), но это не всегда так.