Если я повторю каждое наблюдение выборки в модели линейной регрессии и перезапущу регрессию, как повлияет на результат?

15

Скажем, у меня есть N наблюдений, возможно, несколько факторов, и я повторяю каждое наблюдение дважды (или М раз), как регрессия на этом новом наборе ЯМ размера будет сравниваться с регрессией только на исходных наблюдениях?

regression linear-model multiple-regression

— Дворец Чан
источник

13

Концептуально вы не добавляете «новую» информацию, но вы «знаете» эту информацию более точно.

Следовательно, это привело бы к тем же коэффициентам регрессии с меньшими стандартными ошибками.

Например, в Stata функция расширения x дублирует каждое наблюдение x раз.

sysuse auto, clear
regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515    .001586    -2.43   0.018    -.0070138   -.0006891
      length |  -.0795935   .0553577    -1.44   0.155    -.1899736    .0307867
       _cons |   47.88487    6.08787     7.87   0.000       35.746    60.02374
------------------------------------------------------------------------------

expand 5

regress mpg weight length
------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0038515   .0006976    -5.52   0.000    -.0052232   -.0024797
      length |  -.0795935   .0243486    -3.27   0.001    -.1274738   -.0317131
       _cons |   47.88487   2.677698    17.88   0.000     42.61932    53.15043
------------------------------------------------------------------------------

Как вы можете видеть, незначительные коэффициенты (длина) становятся статистически значимыми в расширенной модели, представляя точность, с которой вы «знаете» то, что знаете.

— pmgjones
источник

Да, стандартные ошибки действительно снижаются. Некоторые рекомендуют для этого взвешенную линейную регрессию. Есть ли метод, который вы используете, чтобы исправить это?

— BBDynSys

3

{вес}^{*} знак равно {argmin}_{вес} | | Икс вес - Y | |^{2}

$w^* = \mbox{argmin}_w ||Xw - y||^2$

X

$X$

y

$y$

M

$M$

M

$M$

— Innuo
источник

Согласен, но я думаю, что статистика и стандартные ошибки должны измениться с учетом изменения с N на NM?

— Дворец Чан

M * N - P

$M*N - P$

N

$N$

P

$P$

M

$M$