Доверительный интервал для различия средств в регрессии

Предположим, у меня есть модель квадратичной регрессии с ошибками удовлетворяющими обычным предположениям (независимым, нормальным, независимым от значений ). Пусть - оценки наименьших квадратов.

Y = β_{0} + β_{1} X + β_{2} X^{2} + ϵ

$Y = \beta_0 + \beta_1 X + \beta_2 X^2 + \epsilon$

ϵ

$\epsilon$

X

$X$

b_{0}, b_{1}, b_{2}

$b_0, b_1, b_2$

У меня есть два новых значения и , и я заинтересован в получении доверительного интервала для . $X$ $x_1$ $x_2$ $v = E(Y|X = x_2) - E(Y|X=x_1) = \beta_1 (x_2 - x_1) + \beta_2 (x_2^2 - x_1^2)$

Точечная оценка: , и (исправьте меня, если я ошибаюсь) я могу оценить дисперсию с помощью с использованием оценок дисперсии и ковариации коэффициентов, предоставленных программным обеспечением. $\hat{v} = b_1 (x_2 - x_1) + b_2 (x_2^2 - x_1^2)$

{\hat{s}}^{2} = (x_{2} - x_{1})^{2} Var (b_{1}) + (x_{2}^{2} - x_{1}^{2})^{2} Var (b_{2}) + 2 (x_{2} - x_{1}) (x^{2} - x_{1}^{2}) Cov (b_{1}, b_{2})

$\hat{s}^2 = (x_2 - x_1)^2 \text{Var}(b_1) + (x_2^2 - x_1^2)^2 \text{Var}(b_2) + 2 (x_2 - x_1)(x^2 - x_1^2)\text{Cov}(b_1, b_2)$

Я мог бы использовать нормальное приближение и взять в качестве 95% -ного доверительного интервала для , или я мог бы использовать доверительный интервал начальной загрузки, но есть ли способ определить точное распределение и использовать это? $\hat{v} \pm 1.96 \hat{s}$ $v$

regression confidence-interval

— mark999
источник

Поскольку ошибки предполагаются нормальными, то оценки параметров, являющиеся линейными функциями данных, откуда и ошибки, сами должны быть нормальными, что подразумевает нормальное распределение для .

\hat{v}

$\hat{v}$

— whuber

Так вы говорите, что нормальный доверительный интервал правильный? Если я правильно понимаю, по этой логике мы также будем использовать нормальные доверительные интервалы для параметров. Но мы используем интервалы, основанные на распределении t.

— mark999

Распределение t используется, потому что вы оцениваете дисперсию ошибки; если бы это было известно, то у вас был бы нормальный дистрибутив, как говорит @whuber.

— JMS

Спасибо за ваш комментарий. Я спрашиваю, можно ли также использовать распределение t для доверительного интервала для v, как это определено в вопросе, и, если да, со сколькими степенями свободы?

— mark999

Все дисперсии и ковариации в конечном итоге зависят от оценочной дисперсии остатков. Таким образом, DF для использования - это DF в этой оценке, равный количеству значений данных минус количество параметров (включая константу).

— whuber

Общий результат вы ищете (при сделанных предположениях) выглядит следующим образом : Для линейной регрессии с предикторами ( у вас есть два, и ) и перехват, то с наблюдениями, матрица плана , мерной оценки и $p$ $X$ $X^2$ $n$ $\mathbf{X}$ $n \times (p+1)$ $\hat{\beta}$ $p+1$ $a \in \mathbb{R}^{p+1}$

\frac{a^{T} \hat{β} - a^{T} β}{\hat{σ} \sqrt{a^{T} (X^{T} X)^{- 1} a}} \sim t_{n - p - 1} .

$\frac{a^T\hat{\beta} - a^T \beta}{\hat{\sigma} \sqrt{a^T(\mathbf{X}^T\mathbf{X})^{-1}a}} \sim t_{n-p-1}.$

В результате вы можете построить доверительные интервалы для любой линейной комбинации вектора используя то же распределение, которое вы используете для построения доверительного интервала для одной из координат. $\beta$ $t$

В вашем случае и . Знаменатель в приведенной выше формуле является квадратным корнем того, что вы вычисляете как оценку стандартной ошибки (при условии, что это то, что вычисляет программное обеспечение ...). Обратите внимание, что оценщик дисперсии, , должен быть (обычным) объективным оценщиком, где вы делите на степени свободы, , а не на количество наблюдений . $p = 2$ $a^T = (0, x_2 - x_1, x_2^2 - x_1^2)$ $\hat{\sigma}^2$ $n-p-1$ $n$

— NRH
источник

Спасибо, это именно то, что я искал. Но есть ли ошибка в формуле? Размеры не совпадают в . Должна ли иметь матрицу имеющую матрицы в первом столбце?

a^{T} (X^{T} X)^{- 1} a

$a^T(\mathbf{X}^T\mathbf{X})^{-1}a$

X

$\mathbf{X}$

n \times (p + 1)

$n \times (p+1)$

— mark999

@ mark999, да, имеет столбцов. Я исправил это в ответе. Спасибо.

X

$\mathbf{X}$

p + 1

$p+1$

— NRH