Я хочу включить термин и его квадрат (переменные предиктора) в регрессию, потому что я предполагаю, что низкие значения положительно влияют на зависимую переменную, а высокие значения оказывают отрицательное влияние. должен захватить эффект более высоких значений. Поэтому я ожидаю, что коэффициент будет положительным, а коэффициент будет отрицательным. Помимо , я также включаю другие переменные предиктора.
Я читал в некоторых сообщениях здесь, что это хорошая идея, чтобы центрировать переменные в этом случае, чтобы избежать мультиколлинеарности. При проведении множественной регрессии, когда вы должны центрировать свои предикторные переменные и когда вы должны стандартизировать их?
Должен ли я центрировать обе переменные по отдельности (в среднем), или я должен центрировать только а затем взять квадрат или я должен центрировать только х 2 и включить исходный х ?
Это проблема, если является переменной подсчета?
Чтобы не считать переменной-счетчиком, я подумал о том, чтобы разделить ее на теоретически определенную площадь, например, на 5 квадратных километров. Это должно быть немного похоже на расчет плотности точек.
Однако я боюсь, что в этой ситуации мое первоначальное предположение о знаке коэффициентов больше не будет выполнено, как, например, когда и x ² = 4
= 0,4 км 2
но затем будет меньшепотому что х 2 = ( 2 / 5 ) 2 = 0,16 .