Предположим, у меня есть некоторая переменная ответа которая была измерена от го брата в м семействе. Кроме того, некоторые поведенческие данные были собраны в то же время от каждого субъекта. Я пытаюсь проанализировать ситуацию с помощью следующей линейной модели смешанных эффектов: j i x i j
где и - фиксированный перехват и наклон соответственно, - случайный наклон, а - остаток.α 1 δ 1 i ε i j
Предположения для случайных эффектов и residual : (при условии, что в каждом семействе только два родных брата) ε i j
где - неизвестный параметр дисперсии, а дисперсионно-ковариационная структура - симметричная матрица формы 2 x 2
это моделирует корреляцию между двумя братьями и сестрами.
Это подходящая модель для такого исследования родного брата?
Данные немного сложнее. Среди 50 семей около 90% из них - близнецы-дизиготы. Для остальных семей,
- двое имеют только одного родного брата;
- двое имеют одну пару DZ плюс один родной брат; и
- у двух есть одна пара DZ плюс два дополнительных родных брата.
Я верю,
lme
что пакет Rnlme
может легко справиться (1) с отсутствующей или несбалансированной ситуацией. Моя проблема в том, как бороться с (2) и (3)? Одна возможность, которую я могу придумать, состоит в том, чтобы разбить каждое из этих четырех семейств в (2) и (3) на два, чтобы каждое подсемейство имело одного или двух братьев и сестер, чтобы вышеупомянутая модель все еще могла применяться. Это нормально? Другим вариантом было бы просто выбросить данные из дополнительных одного или двух братьев и сестер в (2) и (3), что кажется пустой тратой. Есть ли подходы лучше?Кажется, что это
lme
позволяет зафиксировать значения в остаточной дисперсионно-ковариационной матрице , например, = 0,5. Имеет ли смысл навязывать структуру корреляции, или я должен просто оценить ее на основе данных?
lme