В чем разница между множителем MIMIC и композитом с показателями (SEM)?

В моделировании структурных уравнений со скрытыми переменными (SEM), общей формулировкой модели является «Множественный индикатор, множественная причина» (MIMIC), где скрытая переменная вызывается одними переменными и отражается другими. Вот простой пример:

По сути, f1это результат регрессии для x1, x2и x3, и y1, y2и y3являются индикаторами измерения для f1.

Можно также определить составную скрытую переменную, где скрытая переменная в основном составляет взвешенную комбинацию составляющих ее переменных.

Вот мой вопрос: есть ли разница между определением f1в качестве результата регрессии и определением его как составного результата в модели MIMIC?

Некоторое тестирование с использованием lavaanпрограммного обеспечения Rпоказывает, что коэффициенты идентичны:

library(lavaan)

# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))

# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
    f1 =~ y1 + y2 + y3
    f1 ~ x1 + x2 + x3
'

# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
    f1 =~ y1 + y2 + y3
    f1 <~ x1 + x2 + x3
'

# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)

# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"

Как эти две модели математически одинаковы? Насколько я понимаю, что формулы регрессии в SEM принципиально отличаются от составных формул, но этот вывод, похоже, отвергает эту идею. Кроме того, легко придумать модель, в которой ~оператор не взаимозаменяем с <~оператором (для использования lavaanсинтаксиса s). Обычно использование одного вместо другого приводит к проблеме идентификации модели, особенно когда скрытая переменная затем используется в другой формуле регрессии. Так когда же они взаимозаменяемы, а когда нет?

Учебник Рекса Клайна (Принципы и практика моделирования структурных уравнений) имеет тенденцию говорить о моделях MIMIC с терминологией композитов, но Ив Россел, автор lavaan, явно использует оператор регрессии в каждом примере MIMIC, который я видел.

Может кто-нибудь прояснить этот вопрос?

sem latent-variable lavaan

— DMP
источник

Они одна и та же модель.

Полезно иметь возможность определить скрытую переменную как составной результат, в котором эта переменная имеет только составные показатели.

Если у вас нет:

f1 =~ y1 + y2 + y3

Вы не можете поставить:

f1 ~ x1 + x2 + x3

Но вы можете иметь:

f1 <~ x1 + x2 + x3

— Джереми Майлз
источник

Спасибо! Не могли бы вы уточнить, почему вы не можете иметь f1 ~ x1 + x2 + x3, но вы можете иметь f1 <~ x1 + x2 + x3?

— dmp

Поскольку в первом случае f1 еще не является переменной в модели, поскольку она скрыта, вам необходимо определить ее.

— Джереми Майлз

Если у вас была такая модель, вы должны были использовать трюк типа f1 = ~ 0 * x1, чтобы у вас был скрытый var, который затем можно использовать в f ~ x1 + x2 + x3.

— Джереми Майлз