Выбор весов путей в концептуальных моделях SEM для идентичных и братских близнецов с использованием openMx


10

Я рассматриваю пакет R OpenMx для анализа генетической эпидемиологии, чтобы узнать, как определить и подобрать модели SEM. Я новичок в этом, так что терпите меня. Я следую примеру на странице 59 Руководства пользователя OpenMx . Здесь они рисуют следующую концептуальную модель:

SEM модели для идентичных и братских близнецов

И при указании путей они устанавливают вес скрытого «одного» узла для проявленных узлов bmi «T1» и «T2» равным 0,6, потому что:

Основные представляющие интерес пути - это пути от каждой из скрытых переменных к соответствующей наблюдаемой переменной. Они также оцениваются (таким образом, все они освобождаются), получают начальное значение 0,6 и соответствующие метки.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

Значение 0,6 происходит от расчетной ковариации bmi1и bmi2(строго моно- зиготических пары близнецов). У меня есть два вопроса:

  1. Когда они говорят, что для пути задано «начальное» значение 0,6, это похоже на установку процедуры численного интегрирования с начальными значениями, как при оценке GLM?

  2. Почему это значение оценивается строго по монозиготным близнецам?

Ответы:


4

Чтобы ответить на ваши 2 балла:

1) Да, именно так: начальное значение просто определяет, где алгоритм начнет процесс оптимизации. Большинство программных пакетов фактически определяют свои собственные начальные значения по умолчанию, и пользователь должен пытаться вводить разные значения только тогда, когда возникают проблемы во время оценки. Из моего опыта подойдут наиболее вероятные начальные значения, и они не изменят окончательную модель, на которой сходится алгоритм.

2) Значение 0,6 является начальным значением не для пересечения T1 и T2 (путь между «одним» и T1 & T2), но вместо этого оно является начальным значением для нагрузок фактора, связывающих каждую скрытую переменную (A, C, E ) к их индикатору T1 или T2. На это указывает тот факт, что путь идет from=c("A1","C1","E1"), to="bmi1"в первом случае, а from=c("A2","C2","E2"), to="bmi2"во втором случае.

Что касается конкретного значения «0,6»: я не смог найти в документации, где они упоминают принятие этого значения на основе подгруппы монозиготных близнецов; и на самом деле, эти оценки параметров (коэффициенты загрузки для 3 скрытых переменных) не могут быть напрямую вычислены из выборки, поскольку по определению эти скрытые переменные не соблюдаются (они являются скрытыми). Как я упоминал в пункте № 1, выбор между двумя вероятными значениями редко влияет на оценки параметров сходящейся модели, поэтому я предполагаю, что они просто выбрали одно из многих вероятных значений для этих нагрузок фактора в качестве начальных значений. Приходит ли это значение из предполагаемой ковариации между bmi1 и bmi2 только в подгруппе монозиготных близнецов, не имеет значения, поскольку любые вероятные начальные значения должны приводить к тому, что алгоритм сходится к одним и тем же конечным значениям, возможно, с некоторыми различиями во времени вычислений. (И мой совет убедить себя: попробуйте! Попробуйте несколько начальных значений и сравните оценки параметров сходящихся моделей.)

В качестве общего замечания я укажу, что выбор начальных значений для любой оценки параметра становится ОЧЕНЬ важным, если для аргумента freeзадано значение FALSE, поскольку начальное значение фактически станет значением оценки параметра в окончательной модели (это не будет быть оцененным, это фиксируется перед оценкой).

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.