В каких обстоятельствах вы хотите или не хотите масштабировать или стандартизировать переменную до подбора модели? И каковы преимущества / недостатки масштабирования переменной?
В каких обстоятельствах вы хотите или не хотите масштабировать или стандартизировать переменную до подбора модели? И каковы преимущества / недостатки масштабирования переменной?
Ответы:
Стандартизация - все о весах различных переменных для модели. Если вы выполняете стандартизацию «только» ради численной стабильности, могут быть преобразования, которые дают очень похожие числовые свойства, но различаются физическим смыслом, который может быть гораздо более подходящим для интерпретации. То же самое относится и к центрированию, которое обычно является частью стандартизации.
Ситуации, когда вы, вероятно, хотите стандартизировать:
Ситуации, когда вы можете не захотеть стандартизировать:
Вы можете сделать что-то «между» и преобразовать переменные или выбрать единицу, чтобы новые переменные все еще имели физический смысл, но вариация числового значения не была такой разной, например
Аналогично для центрирования:
В общем, я не рекомендую масштабирование или стандартизацию, если это не является абсолютно необходимым. Преимущество или привлекательность такого процесса заключается в том, что, когда объясняющая переменная имеет совершенно другое физическое измерение и величину, чем переменная отклика, масштабирование посредством деления на стандартное отклонение может помочь с точки зрения численной стабильности и позволяет сравнивать эффекты по нескольким объясняющие переменные. При наиболее распространенной стандартизации эффект переменной - это величина изменения ответной переменной, когда пояснительная переменная увеличивается на одно стандартное отклонение; это также указывает на то, что значение эффекта переменной (величина изменения в переменной отклика, когда объясняющая переменная увеличивается на одну единицу) будет потеряно, хотя статистическое значение для объясняющей переменной остается неизменным. Тем не мение, когда взаимодействие рассматривается в модели, масштабирование может быть очень проблематичным даже для статистического тестирования из-за сложности, связанной с корректировкой стохастического масштабирования при вычислении стандартной ошибки эффекта взаимодействия (Preacher, 2003). По этой причине масштабирование на стандартное отклонение (или стандартизацию / нормализацию), как правило, не рекомендуется, особенно когда речь идет о взаимодействиях.
Preacher, KJ, Curran, PJ, and Bauer, DJ, 2006. Вычислительные инструменты для исследования эффектов взаимодействия при множественной линейной регрессии, многоуровневом моделировании и анализе скрытых кривых. Журнал образовательной и поведенческой статистики, 31 (4), 437-448.