Рассмотрим следующую фигуру из линейных моделей Faraway с R (2005, стр. 59).
Первый график, по-видимому, указывает на то, что остатки и подогнанные значения некоррелированы, поскольку они должны быть в гомоскедастической линейной модели с нормально распределенными ошибками. Поэтому второй и третий графики, которые, кажется, указывают на зависимость между невязками и подобранными значениями, предлагают другую модель.
Но почему второй график предполагает, как отмечает Фарауэй, гетероскедастическую линейную модель, в то время как третий график предлагает нелинейную модель?
Второй график, по-видимому, указывает на то, что абсолютное значение остатков сильно положительно коррелирует с подобранными значениями, тогда как на третьем графике такой тенденции не наблюдается. Так что если бы это было так, теоретически, в гетероскедастической линейной модели с нормально распределенными ошибками
(где выражение слева представляет собой матрицу дисперсии-ковариации между невязками и подобранными значениями), это объясняет, почему второй и третий графики согласуются с интерпретациями Faraway.
Но так ли это? Если нет, то как еще могут быть оправданы интерпретации Faraway второго и третьего сюжетов? Кроме того, почему третий график обязательно указывает на нелинейность? Возможно ли, что она линейна, но ошибки либо не распределены нормально, либо распределены нормально, но не центрированы вокруг нуля?