Итог из пяти пунктов
да, идея состоит в том, чтобы дать краткое описание распределения. Он должен быть примерно симметричным относительно среднего значения, медиана должна быть близка к 0, значения 1Q и 3Q в идеале должны быть примерно одинаковыми значениями.
Коэффициенты иβi^s
Каждый коэффициент в модели является гауссовой (нормальной) случайной величиной. является оценкой среднего распределения этой случайной величины, и стандартная ошибка есть квадратный корень из дисперсии этого распределения. Это мера неопределенности в оценке .βi^βi^
Вы можете посмотреть, как они вычисляются (хорошо используются математические формулы) в Википедии . Обратите внимание, что любая уважающая себя программа статистики не будет использовать стандартные математические уравнения для вычисления потому что выполнение их на компьютере может привести к большой потере точности вычислений.βi^
t статистика
В статистические оценки ( ) делится на их стандартные ошибки ( ), например . Предполагая, что вы имеете ту же модель в объекте, что и ваш Q:tβi^σi^ti=βi^σi^mod
> mod <- lm(Sepal.Width ~ Petal.Width, data = iris)
тогда значения отчетов R вычисляются как:t
> tstats <- coef(mod) / sqrt(diag(vcov(mod)))
(Intercept) Petal.Width
53.277950 -4.786461
Где coef(mod)
находятся и дает квадратные корни диагональных элементов ковариационной матрицы параметров модели, которые являются стандартными ошибками параметров ( ).βi^sqrt(diag(vcov(mod)))
σi^
Значение p - это вероятность достижения aравным или превышающим наблюдаемое абсолютное значение t, если нулевая гипотеза ( ) была верной, где равно . Они вычисляются как (используя сверху):|t|H0H0βi=0tstats
> 2 * pt(abs(tstats), df = df.residual(mod), lower.tail = FALSE)
(Intercept) Petal.Width
1.835999e-98 4.073229e-06
Таким образом, мы рассчитываем верхнюю хвостовую вероятность достижения значений мы сделали из распределения со степенями свободы, равными остаточным степеням свободы модели. Это представляет вероятность достижения значения большего, чем абсолютные значения наблюдаемых s. Он умножается на 2, потому что, конечно, может быть большим и в отрицательном направлении.ttttt
Остаточная стандартная ошибка
Остаточная стандартная ошибка является оценкой параметра . Предположение в обычных наименьших квадратах состоит в том, что невязки индивидуально описываются гауссовым (нормальным) распределением со средним 0 и стандартным отклонением . относится к постоянной дисперсии предположения; каждый остаток имеет одинаковую дисперсию, и эта дисперсия равна .σσσσ2
СкорректированоR2
Скорректированный рассчитывается как:R2
1−(1−R2)n−1n−p−1
Скорректированный - это то же самое, что и , но с учетом сложности (то есть количества параметров) модели. При наличии модели с одним параметром, с определенным , если мы добавим еще один параметр в эту модель, новой модели должен возрасти, даже если добавленный параметр не имеет статистической мощности. Скорректированная учитывает это путем включения количества параметров в модель.R2R2R2R2R2
F -статистический
представляет собой отношение двух дисперсий ( ), дисперсия объясняется параметрами в модели (сумма квадратов регрессии, SSR) и остаточная дисперсией или необъяснимой (сумма квадратов ошибок, SSE). Вы можете увидеть это лучше, если мы получим таблицу ANOVA для модели через :FSSR/SSEanova()
> anova(mod)
Analysis of Variance Table
Response: Sepal.Width
Df Sum Sq Mean Sq F value Pr(>F)
Petal.Width 1 3.7945 3.7945 22.91 4.073e-06 ***
Residuals 148 24.5124 0.1656
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
В s являются одинаковыми в выходных данных ANOVA и выход. Столбец содержит две дисперсии и . Мы можем вычислить вероятность достижения такого большого значения при нулевой гипотезе отсутствия эффекта из распределения с 1 и 148 степенями свободы. Это то, что сообщается в последнем столбце таблицы ANOVA. В простом случае одного непрерывного предиктора (согласно вашему примеру) , поэтому значения p одинаковы. Эта эквивалентность имеет место только в этом простом случае.Fsummary(mod)
Mean Sq
3.7945/0.1656=22.91FFF=t2Petal.Width