Тест Вальда в регрессии (OLS и GLM): распределение t- и z-распределения

22

Я понимаю, что критерий Вальда для коэффициентов регрессии основан на следующем свойстве, которое выполняется асимптотически (например, Вассерман (2006): Вся статистика , стр. 153, 214-215): Где обозначает предполагаемый коэффициент регрессии, обозначает стандартную ошибку коэффициента регрессии, а представляет собой интересующее значение ( обычно равно 0, чтобы проверить, является ли коэффициент значительно отличается от 0). Итак, тест size Wald: отклонить когда

\frac{(\hat{β} - β_{0})}{\hat{се} (\hat{β})} ~ N (0, 1)

$\frac{(\hat{\beta}-\beta_{0})}{\widehat{\operatorname{se}}(\hat{\beta})}\sim \mathcal{N}(0,1)$

\hat{β}

$\hat{\beta}$

\hat{se} (\hat{β})

$\widehat{\operatorname{se}}(\hat{\beta})$

β_{0}

$\beta_{0}$

β_{0}

$\beta_{0}$

α

$\alpha$

H_{0}

$H_{0}$

| W | > z_{α / 2}

$|W|> z_{\alpha/2}$ где

W знак равно \frac{\hat{β}}{\hat{се} (\hat{β})},

$W=\frac{\hat{\beta}}{\widehat{\operatorname{se}}(\hat{\beta})}.$

Но когда вы выполняете линейную регрессию с помощью lmв R, значение вместо значения используется для проверки, значительно ли отличаются коэффициенты регрессии от 0 (с ). Кроме того, вывод в R иногда дает - и иногда качестве тестовой статистики. По-видимому, значения используются, когда предполагается, что параметр дисперсии известен, а значения используются, когда оценивается параметр дисперсии (см. Эту ссылку ). $t$ $z$ summary.lmglm $z$ $t$ $z$ $t$

Может ли кто-нибудь объяснить, почему распределение иногда используется для теста Вальда, даже если предполагается, что отношение коэффициента и его стандартной ошибки распределено как стандартная норма? $t$

Изменить после ответа на вопрос

Этот пост также предоставляет полезную информацию к вопросу.

r regression hypothesis-testing generalized-linear-model

— COOLSerdash
источник

2

Что заставляет вас думать, что представляемая статистика теста обязательно является тестом Вальда?

— Glen_b

3

Поскольку

или

значения всегда являются коэффициентом, деленным на его стандартную ошибку в и .

z

$z$

t

$t$ lmglm

— COOLSerdash

20

Результат glmиспользования распределения Пуассона дает значение, потому что с распределением Пуассона среднее значение и параметр дисперсии одинаковы. В модели Пуассона вам нужно оценить только один параметр ( ). Там, где вы должны оценить как среднее значение, так и параметр дисперсии, вы должны увидеть используемое распределение. $z$ $\lambda$ glm $t$

Для стандартной линейной регрессии предполагается, что термин ошибки обычно распределен. Здесь должен быть оценен параметр дисперсии - отсюда использование распределения для тестовой статистики. Если вы как-то знали дисперсию популяции для термина ошибки, вы могли бы вместо этого использовать статистику -test. $t$ $z$

$t$

— wcampbell
источник

3

В целом, в рамках GLM, упомянутая вами статистика W- теста асимптотически нормально распределена, поэтому вы видите в R значения z .

В дополнение к этому, при работе с линейной моделью, т. Е. GLM с нормальной распределенной переменной отклика, распределение статистики теста - это t ученика , поэтому в R у вас есть t значений.

— EdoLu
источник