У меня есть набор данных по сельскохозяйственным испытаниям. Моя переменная ответа - это соотношение ответов: log (лечение / контроль). Меня интересует, что опосредует разницу, поэтому я использую мета-регрессии RE (невзвешенные, потому что кажется довольно ясным, что величина эффекта не связана с дисперсией оценок).
Каждое исследование сообщает урожай зерна, урожай биомассы или оба. Я не могу вписать урожай зерна из исследований, в которых сообщается только об урожае биомассы, потому что не все изученные растения были полезны для зерна (например, сахарный тростник). Но каждое растение, которое производило зерно, также имело биомассу.
Для пропущенных ковариат я использовал итеративное регрессионное вменение (следуя главе учебника Эндрю Гельмана). Кажется, он дает разумные результаты, и весь процесс в целом интуитивно понятен. По сути, я прогнозирую пропущенные значения и использую эти прогнозируемые значения для прогнозирования пропущенных значений, и перебираю каждую переменную до тех пор, пока каждая переменная не приблизится приблизительно (в распределении).
Есть ли какая-то причина, по которой я не могу использовать тот же процесс для расчета отсутствующих данных о результатах? Я могу, вероятно, сформировать относительно информативную модель вменения для отношения реакции биомассы, учитывая отношение реакции зерна, тип культуры и другие ковариаты, которые у меня есть. Затем я усредняю коэффициенты и VCV и добавляю коррекцию MI в соответствии со стандартной практикой.
Но что измеряют эти коэффициенты, когда вменяются сами результаты? Отличается ли интерпретация коэффициентов от стандартной МИ для ковариат? Размышляя об этом, я не могу убедить себя, что это не работает, но я не совсем уверен. Мысли и предложения для чтения материала приветствуются.