В моделировании структурных уравнений со скрытыми переменными (SEM), общей формулировкой модели является «Множественный индикатор, множественная причина» (MIMIC), где скрытая переменная вызывается одними переменными и отражается другими. Вот простой пример:

По сути, f1это результат регрессии для x1, x2и x3, и y1, y2и y3являются индикаторами измерения для f1.
Можно также определить составную скрытую переменную, где скрытая переменная в основном составляет взвешенную комбинацию составляющих ее переменных.
Вот мой вопрос: есть ли разница между определением f1в качестве результата регрессии и определением его как составного результата в модели MIMIC?
Некоторое тестирование с использованием lavaanпрограммного обеспечения Rпоказывает, что коэффициенты идентичны:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
Как эти две модели математически одинаковы? Насколько я понимаю, что формулы регрессии в SEM принципиально отличаются от составных формул, но этот вывод, похоже, отвергает эту идею. Кроме того, легко придумать модель, в которой ~оператор не взаимозаменяем с <~оператором (для использования lavaanсинтаксиса s). Обычно использование одного вместо другого приводит к проблеме идентификации модели, особенно когда скрытая переменная затем используется в другой формуле регрессии. Так когда же они взаимозаменяемы, а когда нет?
Учебник Рекса Клайна (Принципы и практика моделирования структурных уравнений) имеет тенденцию говорить о моделях MIMIC с терминологией композитов, но Ив Россел, автор lavaan, явно использует оператор регрессии в каждом примере MIMIC, который я видел.
Может кто-нибудь прояснить этот вопрос?
f1 ~ x1 + x2 + x3, но вы можете иметьf1 <~ x1 + x2 + x3?