Предлагаемые ответы дают мне некоторые идеи о том, что здесь происходит. Я верю, что, возможно, были допущены некоторые ошибки случайно. Посмотрите, имеет ли смысл следующая история: Для начала, я думаю, что, вероятно, существует сильная связь между X & Y в данных (вот некоторый код и сюжет):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Но по ошибке Y был предсказан только из среднего. Сложив это, остатки от средней только модели строятся на графике против X, даже при том, что предполагалось построить график с использованием соответствующих значений (код и график):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Мы можем исправить это, подбирая подходящую модель и вычерчивая на ней остатки (код и график):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Это похоже на те глупости, которые я сделал, когда начинал.