Чтобы понять , почему мы используем распределение Стьюдента, вы должны знать , что лежит в основе распределения р и остаточной суммы квадратов ( R S S ) , поскольку эти два вместе взятые даст вам распределение Стьюдента.βˆRSS
Легче часть является распределение р , которое является нормальным распределением - видеть это примечание , что β = ( Х Т Х ) - 1 х Т У , так что линейная функция Y , где Y ~ N ( X β , σ 2 я н ) . В результате он также распределен нормально, β ~ N ( р , σ 2 ( Х Т Х ) -βˆβˆ(XTX)−1XTYYY∼N(Xβ,σ2In)- дайте мне знатьесли вам нужна помощь выведение распределения р .βˆ∼N(β,σ2(XTX)−1)βˆ
Кроме того, , где n - количество наблюдений, а p - количество параметров, используемых в вашей регрессии. Доказательство этого немного сложнее, но его также легко получить (см. Доказательство здесь. Почему RSS распределяется по хи-квадрат раз np? ).RSS∼σ2χ2n−pnp
До этого момента я не рассмотрел все в матрицу / вектор обозначения, но давайте для простоты использования β I и использовать его нормальное распределение , которое даст
нам: β я - β яβˆi
βˆi−βiσ(XTX)−1ii−−−−−−−−√∼N(0,1)
Кроме того, из хи-квадрат распределения имеем:
( n - p ) s 2RSS
(n−p)s2σ2∼χ2n−p
N(0,1)s2=RSSn−pσ2tn−pχ2(s)/s−−−−−−√
βˆi−βis(XTX)−1ii−−−−−−−−√∼tn−p
s(XTX)−1ii−−−−−−−−√=SE(βˆi)
Дайте мне знать, если это имеет смысл.