В общем, я стандартизирую свои независимые переменные в регрессиях, чтобы правильно сравнить коэффициенты (таким образом, они имеют одинаковые единицы: стандартные отклонения). Однако с панельными / продольными данными я не уверен, как мне следует стандартизировать мои данные, особенно если я оцениваю иерархическую модель.
Чтобы понять, почему это может быть потенциальной проблемой, предположим, что у вас есть особей, измеренных по периодам t = 1 , … , T, и вы измерили зависимую переменную, y i , t и одну независимую переменную x i , t , Если вы выполняете полную регрессию пула, тогда можно стандартизировать ваши данные следующим образом: x . z = ( x - среднее ( x ) ) / sd ( x , так как он не изменит t-статистику. С другой стороны, если вы подходите к нерегулярной регрессии, т. Е. По одной регрессии для каждого человека, то вам следует стандартизировать данные только по отдельным лицам, а не по всему набору данных (в коде R):
for (i in 1:n) {
for ( t in 1:T) x.z[i] = (x[i,t] - mean(x[i,]))/sd(x[i,])
}
Однако, если вы подходите к простой иерархической модели с различным перехватом по отдельным лицам, то вы используете оценку усадки, т. Е. Вы оцениваете модель между объединенной и не объединенной регрессией. Как мне стандартизировать мои данные? Используя все данные как объединенную регрессию? Использование только отдельных лиц, как в случае без пула?