Y= β0+ β1Икс+ εгде ε ∼ N( 0 , σ2ε)
β0+ β1Иксσ2ε
σ2εИксYεβ0, β 1, σ 2ε)Иксσ2ε
Y= β0+ β1Икс+ εгде ε ∼ N( 0 , ф( X) ) где ф( X) = exp( γ0+ γ1Икс)и γ1≠ 0
Иксе(X) Икс
Икс, Тем не менее, я склонен думать, что лучше всего смотреть на графики. @Penquin_Knight проделал хорошую работу, показав, как выглядит постоянная дисперсия, построив графики остатков модели, в которой гомоскедастичность достигается в сравнении с подобранными значениями. Гетероскедастичность также может быть обнаружена на графике необработанных данных или на графике масштаба (также называемом уровнем распространения). R удобно готовит последний для вас с вызовом plot.lm(model, which=2)
; это квадратный корень из абсолютных значений остатков по отношению к установленным значениям, с наложенной на них кривой низкого значения . Вы хотите, чтобы нижняя посадка была плоской, а не наклонной.
Рассмотрим графики, приведенные ниже, в которых сравнивается, как гомосцедастические и гетероскедастические данные могут выглядеть на этих трех различных типах фигур. Обратите внимание на форму воронки для двух верхних гетероскедастических графиков и восходящую низкую линию на последнем.
Для полноты вот код, который я использовал для генерации этих данных:
set.seed(5)
N = 500
b0 = 3
b1 = 0.4
s2 = 5
g1 = 1.5
g2 = 0.015
x = runif(N, min=0, max=100)
y_homo = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2 ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))
mod.homo = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)