В примере @ Peter есть два элемента, которые может быть полезно распутать:
(1) Неправильная спецификация модели. Модели
yi=β0+β1xi+εi(1)
&
wi=γ0+γ1zi+ζi(2)
где wi=yixi−−√ & , оба не могут быть правдой Если вы повторно выражаете каждый в терминах ответа другого, они становятся нелинейными по параметрам, с гетероскедастическими ошибками.zi=xi−−√
wi=β0z2i+β1+εiz2i−−−−−−−−−−−√(1)
yi=(γ0x−−√i+γ1x−−√i+ζix−−√i)2(2)
Если предполагается, что является гауссовой случайной величиной, независимой от X , то это особый случай модели 1, в которой β 1 = 0 , и вы не должны использовать модель 2. Но в равной степени, если WYXβ1=0W предполагается, что Гауссова случайная переменная, не зависящая от , вы не должны использовать модель 1. Любое предпочтение одной модели, а не другой, должно исходить из материальной теории или их соответствия данным.Z
(2) Преобразование ответа. Если вы знали, что & X является независимой гауссовой случайной величиной, почему связь между W & Z все же вас удивляет или вы бы назвали ее ложной? Условное ожидание W может быть аппроксимировано дельта-методом:YXWZW
EYx−−√=EY−−√z≈β0−−√+VarY8β3/20z
Это действительно функция .z
Следуя примеру ...
set.seed(123)
x <- rnorm(100, 20, 2)
y <- rnorm(100, 20, 2)
w <- (y/x)^.5
z <- x^.5
wrong.model <- lm(w~z)
right.model <- lm(y~x)
x.vals <- as.data.frame(seq(15,25,by=.1))
names(x.vals) <- "x"
z.vals <- as.data.frame(x.vals^.5)
names(z.vals) <- "z"
plot(x,y)
lines(x.vals$x, predict(right.model, newdata=x.vals), lty=3)
lines(x.vals$x, (predict(wrong.model, newdata=z.vals)*z.vals)^2, lty=2)
abline(h=20)
legend("topright",legend=c("data","y on x fits","w on z fits", "truth"), lty=c(NA,3,2,1), pch=c(1,NA,NA,NA))
plot(z,w)
lines(z.vals$z,sqrt(predict(right.model, newdata=x.vals))/as.matrix(z.vals), lty=3)
lines(z.vals$z,predict(wrong.model, newdata=z.vals), lty=2)
lines(z.vals$z,(sqrt(20) + 2/(8*20^(3/2)))/z.vals$z)
legend("topright",legend=c("data","y on x fits","w on z fits","truth"),lty=c(NA,3,2,1), pch=c(1,NA,NA,NA))
yxwzwzможет возникнуть соблазн думать, что вмешательство в увеличение мы можем только надеяться и молиться, чтобы они не поддавались искушению, от которого мы все постоянно предупреждены; это путаница корреляции с причинностью.zw
Aldrich (2005), «Соотношения подлинные и ложные в Пирсоне и Юле», Statistical Science , 10 , 4, представляет интересную историческую перспективу по этим вопросам.