Соответствие показателя склонности после многократного вменения


34

Я ссылаюсь на этот документ: Хейс JR, Groner JI. «Использование нескольких показателей вменения и склонности для проверки влияния автомобильных сидений и ремней безопасности на тяжесть травм на основании данных реестра травм». J Pediatr Surg. Май 2008 года; 43 (5): 924-7.

В этом исследовании была проведена множественная импутация для получения 15 полных наборов данных. Оценки склонности были затем рассчитаны для каждого набора данных. Затем для каждой наблюдательной единицы случайным образом выбиралась запись из одного из 15 законченных наборов данных (включая связанный показатель склонности), создавая тем самым один окончательный набор данных, для которого затем анализировалось сопоставлением показателей склонности.

Мои вопросы: Является ли это действительным способом сопоставления баллов предрасположенности после многократного вменения? Есть ли альтернативные способы сделать это?

Для контекста: в моем новом проекте я стремлюсь сравнить результаты двух методов лечения с использованием сопоставления баллов склонности. Отсутствуют данные, и я намереваюсь использовать MICEпакет в R для вменения пропущенных значений, затем twangдля сопоставления показателей склонности, а затем lme4для анализа сопоставленных данных.

Update1:

Я нашел эту статью, в которой используется другой подход: Митра, Робин и Райтер, Джером П. (2011) Сопоставление оценки склонности с отсутствующими ковариатами посредством повторного последовательного многократного вменения [Рабочий документ]

В этой статье авторы вычисляют оценки склонности по всем вмененным наборам данных, а затем объединяют их путем усреднения, что в духе множественного вменения использует правило Рубина для оценки баллов - но действительно ли оно применимо для оценки склонности?

Было бы очень хорошо, если бы кто-нибудь из CV мог дать ответ с комментариями по этим двум различным подходам и / или любым другим ....

Ответы:


20

Первое, что нужно сказать, это то, что для меня метод 1 (выборка) кажется бесполезным - он отбрасывает преимущества множественного вменения и сводится к одному вменению для каждого наблюдения, как упомянул Стас. Я не вижу никакого преимущества в его использовании.

В Hill (2004) прекрасно обсуждаются вопросы, связанные с анализом оценки предрасположенности с отсутствующими данными: Hill, J. «Сокращение смещения в оценке эффекта лечения в наблюдательных исследованиях, страдающих от отсутствующих данных» ISERP Working Papers, 2004. Его можно загрузить с сюда .

В статье рассматриваются два подхода к использованию множественного вменения (а также другие методы борьбы с отсутствующими данными) и оценки склонности:

  • усреднение оценок предрасположенности после множественного вменения с последующим причинным выводом (метод 2 в вашем посте выше)

  • Причинно-следственный вывод, используя каждый набор оценок склонности из нескольких вменений с последующим усреднением причинно-следственных оценок.

Кроме того, в документе рассматривается вопрос о том, следует ли включать результат в качестве предиктора в модель вменения.

Хилл утверждает, что хотя множественное вменение предпочтительнее других методов работы с отсутствующими данными, в общем случаепричина предпочесть один из этих методов над другим. Однако могут быть причины предпочитать усреднение оценок склонности, особенно при использовании определенных алгоритмов сопоставления. Хилл провел имитационное исследование в той же статье и обнаружил, что усреднение баллов предрасположенности до причинно-следственной связи, когда включение результата в модель вменения дало наилучшие результаты с точки зрения среднеквадратической ошибки, и сначала усреднение баллов, но без результата в модели импутации получены наилучшие результаты с точки зрения среднего смещения (абсолютная разница между оценочным и истинным эффектом лечения). Как правило, желательно включить результат в модель вменения (например, см. Здесь ).

Так что может показаться, что ваш метод 2 - это путь.


1
Я понимаю метод № 2, но я не знаю, как реализовать его в R. Есть ли у кого-нибудь ссылки на меня?
Сэм

2
Код R для обоих методов приведен в виньетке для cobaltпакета под названием «Использование кобальта со сложными данными». Вы можете получить к нему доступ здесь: CRAN.R-project.org/package=cobalt
Noah

13

Там может быть столкновение двух парадигм. Множественное вменение - это байесовское решение в значительной степени основанное на модели: концепция правильного вменения в сущности утверждает, что вам необходимо выбрать из четко определенного апостериорного распределения данных, иначе вы облажались. Сопоставление оценки склонности, с другой стороны, является полупараметрической процедурой: как только вы вычислили свою оценку склонности (независимо от того, как, вы могли бы использовать оценку плотности ядра, не обязательно модель логита), вы можете сделать все остальное. просто взяв различия между обработанными и необработанными наблюдениями с одним и тем же показателем склонности, который сейчас является непараметрическим, так как не осталось модели, которая контролировала бы другие ковариаты. Я неAbadie и Imbens (2008) обсуждали, что это делает невозможным правильное исправление стандартных ошибок в некоторых подходящих ситуациях). Я бы больше доверял более плавным подходам, таким как взвешивание по обратной склонности. Мое любимое упоминание об этом - «В основном безвредная эконометрика» , с подзаголовком «Эмпирический компаньон», предназначенное для экономистов, но я думаю, что эта книга должна быть обязательной для чтения другими учеными-социологами, большинством биостатистиков и небио биографических статистиков, поэтому что они знают, как другие дисциплины подходят к анализу данных.

В любом случае, использование только одной из 15 смоделированных полных линий данных на одно наблюдение эквивалентно одному вменению. В результате вы теряете эффективность по сравнению со всеми 15 законченными наборами данных и не можете правильно оценить стандартные ошибки. Для меня это выглядит как неэффективная процедура с любой точки зрения.

Конечно, мы с радостью примем предположение, что и модель множественного вменения, и модель предрасположенности верны в том смысле, что все правильные переменные имеют правильные функциональные формы. Есть небольшой способ проверить это (хотя я был бы рад услышать иначе о диагностических мерах для обоих этих методов).


(+1) В частности, потому что я не чувствую себя хорошо по поводу разрывов, вызванных буквальной реализацией соответствия (найдите элемент управления с максимально близким значением показателя склонности и игнорируйте остальные) . Оценка склонности всегда казалась мне довольно сложной процедурой.
кардинал

@ Cardinal, смотрите обновление.
StasK

Я на самом деле видел больше критики IPTW, чем я сопоставления другими методами (мне нужно будет прочитать). См. Взвешивание регрессии по оценкам склонности ( Freedman & Berk, 2008 ), а для примера применения см. Bjerk, 2009 . Я не совсем уверен, почему вы рекомендуете безвредную эконометрику в ответ здесь, но это хорошая рекомендация для всех, кто заинтересован в наблюдательных исследованиях, тем не менее.
Энди W

@ Энди, часть «Freedman & Berk», кажется, имеет дело с гораздо более простой ситуацией, когда вы можете моделировать все в логистической регрессии. Насколько я понимаю, такие методы, как PSM, применяются в гораздо более запутанных ситуациях, когда у вас много ковариат, и вы недостаточно доверяете модели, чтобы предположить, что она указана правильно. Они заметили, что ситуация была благоприятной для взвешивания, но я думаю, что это было благоприятно для модели по сравнению с другими возможными методами.
StasK

2
Поскольку ваши данные не идентифицированы, и теорема о максимальном правдоподобии о равенстве обратного гессиана и внешнего произведения градиента больше не выполняется, и ни одна из них не является последовательной оценкой дисперсий. Нужно использовать сэндвич-оценку дисперсии, иначе оценщик линеаризации в статистике обследования, также известный как устойчивый оценщик Белого в эконометрике.
StasK

10

Я не могу говорить о теоретических аспектах вопроса, но я поделюсь своим опытом использования моделей PS / IPTW и множественного вменения.

  1. Я никогда не слышал о том, чтобы кто-то использовал множественные вмененные наборы данных и случайную выборку для создания единого набора данных. Это не обязательно означает, что это неправильно, но это странный подход к использованию. Набор данных также не настолько велик, что вам нужно проявить изобретательность, чтобы обойтись при запуске 3-5 моделей вместо одной, чтобы сэкономить время и вычисления.
  2. Правило Рубина и метод пулирования - довольно общий инструмент. Учитывая, что объединенный, многократно вмененный результат может быть рассчитан с использованием только дисперсии и оценок, я не вижу причин, по которым я не вижу, что он не может быть использован для вашего проекта - создания вмененных данных, выполнения анализа каждого набора и последующего объединения. Это то, что я сделал, это то, что я видел, и если у вас нет особых оснований не делать этого, я не могу найти причину пойти с чем-то более экзотическим - особенно если вы не понимаете, что происходит с методом.

+1 Это вопрос, на который трудно дать хороший ответ, так как он кажется таким узкоспециализированным. Но в дополнение к заявлению о потере награды за предыдущий аналогичный вопрос, OP добавил вопрос, просящий решения, которые были перенесены в meta. Я сделал аналогичные комментарии к вашему в моем ответе там. Я особенно сомневаюсь в отношении выборки из множества вмененных данных.
Майкл Р. Черник

Благодарность ! Есть ли у вас ссылки на то, где был использован метод 2?
Джо Кинг,

@JoeKing К сожалению, не с моей головы.
Fomite
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.