Чем оценки склонности отличаются от добавления ковариат в регрессии, и когда они предпочтительнее последней?


41

Я признаю, что я относительно новичок в оценках предрасположенности и причинного анализа.

Одна вещь, которая не очевидна для меня как новичка, заключается в том, как «балансировка» с использованием показателей склонности математически отличается от того, что происходит, когда мы добавляем ковариаты в регрессию? Чем отличается операция и почему она (или она) лучше, чем добавление ковариат субпопуляции в регрессию?

Я видел некоторые исследования, которые проводят эмпирическое сравнение методов, но я не видел хорошей дискуссии, касающейся математических свойств двух методов и почему PSM поддается каузальным интерпретациям, а включение регрессионных ковариат - нет. Похоже, что в этой области также много путаницы и противоречий, что еще более усложняет задачу.

Любые мысли по этому или какие-либо указатели на хорошие ресурсы / документы, чтобы лучше понять различие? (Я медленно пробираюсь через книгу причинно-следственных связей Иудеи Перл, поэтому нет необходимости указывать мне на это)


3
Рекомендую прочитать Морган и Виншип, 2007 . В главах 4 и 5 проводится явное сравнение и контраст регрессии и сопоставления для идентификации причинно-следственных связей.
сопряженный

1
Когда вы проверяете статистику баланса, вы гарантируете, что нет экстраполяции между группами лечения, которые вы сравниваете в отношении многомерного ковариатного пространства. Регрессия просто экстраполирует, не проверяя это, поэтому экстраполяции могут давать плохие прогнозы.
StatsStudent

Ответы:


17

Одно большое отличие состоит в том, что регрессия «контролирует» эти характеристики линейным способом. Сопоставление по оценкам склонности устраняет предположение о линейности, но, поскольку некоторые наблюдения могут не совпадать, вы не сможете ничего сказать о некоторых группах.

Например, если вы изучаете программу обучения рабочих, у вас могут быть все зачисленные мужчины, но контрольное, не участвующее население состоит из мужчин и женщин. Используя регрессию, вы можете получить регресс, скажем, доход от переменной показателя участия и показателя мужского пола. Вы бы использовали все свои данные и могли бы оценить доход женщины, если бы она участвовала в программе.

Если бы вы занимались сопоставлением, вы могли бы сопоставлять только мужчин с мужчинами. В результате вы не будете использовать женщин в своем анализе, и ваши результаты не будут относиться к ним.

Регрессия может экстраполироваться с использованием предположения о линейности, но сопоставление не может. Все остальные допущения по существу одинаковы между регрессией и сопоставлением. Преимущество сопоставления по сравнению с регрессией заключается в том, что оно непараметрическое (за исключением того, что вы должны предполагать, что у вас есть правильный показатель склонности, если именно так вы делаете сопоставление).

Для получения дополнительной информации, смотрите мою страницу здесь для курса, который был сильно сфокусирован на подходящих методах. Смотрите особенно Предположения стратегии оценки причинно-следственных связей .

Кроме того, обязательно ознакомьтесь со статьей Розенбаума и Рубина (1983), в которой описывается соответствие показателя склонности.

Наконец, сопоставление прошло долгий путь с 1983 года. Посетите веб-страницу Джаса Сехона, чтобы узнать о его алгоритме генетического сопоставления.


3
Возможно, это потому, что я не статистик, но когда кажется, что вы предполагали линейную регрессию, когда ОП спрашивал о регрессии в целом. Но я предполагаю, что суть в том, что добавление ковариат к любому типу регрессора делает некоторые предположения относительно пространства ввода, чтобы он мог экстраполироваться на новые примеры, и сопоставление более осторожно в отношении того, какие вещи можно экстраполировать.
Rrenaud

2
Вы делаете некоторые предположения о функциональной форме смешанных переменных, когда оцениваете функцию склонности. Впоследствии вы также сопоставляете людей, которые имеют «близкие» значения склонности, поэтому я бы не стал сразу предполагать, что сопоставление склонности решает проблему нелинейных воздействующих факторов.
AdamO

2
Ссылки не работают.
Карлос

11

Короткий ответ заключается в том, что показатели предрасположенности не лучше, чем эквивалентная модель ANCOVA, особенно в отношении причинной интерпретации.

Оценки склонности лучше всего понимать как метод сокращения данных. Они являются эффективным средством для уменьшения множества ковариат в единую оценку, которую можно использовать для корректировки интересующего эффекта для набора переменных. При этом вы сохраняете степени свободы, приспосабливаясь к одному показателю склонности, а не к нескольким ковариатам. Это представляет статистическое преимущество, конечно, но не более того.

Один вопрос, который может возникнуть при использовании корректировки регрессии с оценками склонности, заключается в том, есть ли какой-либо выигрыш в использовании показателя склонности, а не в выполнении корректировки регрессии со всеми ковариатами, используемыми для оценки показателя склонности, включенного в модель. Розенбаум и Рубин показали, что «точечная оценка эффекта лечения от анализа корректировки ковариации для многовариантного X равна оценке, полученной из однофакторной ковариационной корректировки для линейного дискриминанта выборки на основе X, всякий раз, когда используется одна и та же ковариационная матрица выборки как для корректировки ковариации, так и для дискриминантного анализа ». Таким образом, результаты обоих методов должны привести к одним и тем же выводам. Тем не мение, Одно из преимуществ выполнения двухэтапной процедуры состоит в том, что в первую очередь можно приспособить очень сложную модель оценки склонности с взаимодействиями и членами более высокого порядка. Поскольку целью этой модели оценки предрасположенности является получение наилучшей оценочной вероятности назначения лечения, никто не обеспокоен чрезмерной параметризацией этой модели.

От:

МЕТОДЫ ИССЛЕДОВАНИЯ ПРИБЛИЗИТЕЛЬНОСТИ ДЛЯ СОКРАЩЕНИЯ БИАСОВ В СРАВНЕНИИ ЛЕЧЕНИЯ С НЕРАНДОМИЗИРОВАННОЙ КОНТРОЛЬНОЙ ГРУППой

Д'Агостино (цитата из Розенбаума и Рубина)

Д'Агостино, Р.Б. 1998. Сопоставление баллов предрасположенности к уменьшению смещения при сравнении лечения с нерандомизированной контрольной группой. Статистическая медицина 17: 2265–2281.



3
Я согласен с общей предпосылкой этого ответа, но когда кто-то соответствует основанным на оценках склонности, это не то же самое, что объединить все ковариаты в модель (и, следовательно, это не просто метод уменьшения размерности). Это не то же самое, если оценивать по склонности.
Энди В.

1
Я не согласен с этим ответом. Оценки склонности хороши, когда они балансируют ковариаты в группах лечения и контроля, и плохо, когда нет. Точно так же, как и при подходе к регрессии. Насколько они лучше, зависит только от этого свойства, которое будет варьироваться от проблемы к проблеме.
сопряженный

1
Я не согласен, потому что, хотя критерий баланса одинаков, две стратегии различны, равно как и их сильные и слабые стороны. Один может или не может быть лучшим подходом, в зависимости от проблемы. В самом деле, « эквивалентная модель ANCOVA», как мне кажется, не очень четко определена. (Эквивалент как?)
конъюгатприор

1
Правильно. Теперь я понимаю, что означает «эквивалент», но предложение, начинающееся с «Тем не менее» в вашей цитате, вводит существенную разницу: на практике проп. оценки оцениваются отдельно именно поэтому они могут быть путь более угловатыми , чем модель анализа. (И есть еще одно различие в статье это следующий пункт, не цитировал.)
conjugateprior

7

Вероятно, тупая ссылка, но если вы случайно получите к ней доступ, я бы порекомендовал прочитать эту главу книги ( Apel and Sweeten, 2010 ). Он нацелен на социологов и, возможно, не настолько математически строг, как вы, кажется, хотите, но он должен углубиться в достаточную глубину, чтобы быть более чем удовлетворительным ответом на ваш вопрос.

Есть несколько разных способов, которыми люди относятся к показателям склонности, которые могут привести к различным выводам из простого включения ковариат в регрессионную модель. Когда кто-то совпадает с баллами, он не обязательно имеет общую поддержку для всех наблюдений (то есть у одного есть некоторые наблюдения, которые, по-видимому, никогда не имеют шанса быть в группе лечения, а некоторые, которые всегда находятся в группе лечения). Также можно оценивать наблюдения различными способами, которые могут привести к различным выводам.

В дополнение к ответам здесь я бы также предложил вам ознакомиться с ответами на приведенный вопрос . За показателями склонности лежит больше вещества, чем просто статистический прием для достижения ковариатного баланса. Если вы прочитаете и поймете цитируемые статьи Розенбаума и Рубина, будет более понятно, почему подход отличается от простого добавления ковариат в регрессионную модель. Я думаю, что более удовлетворительный ответ на ваш вопрос не обязательно в математике за счет склонности, но в их логике.


@Andy W См. Цитату Розенбаума и Рубина об эквивалентности регрессии с ковариатами и корректировкой показателя склонности в моем обновленном посте.
Бретт

0

Мне нравится думать о PS как о конструктивной части исследования, которая полностью отделена от анализа. То есть вы можете подумать с точки зрения дизайна (PS) и анализа (регрессия и т. Д.). Кроме того, PS предоставляет средства поддержки взаимозаменяемости для бинарного лечения; может быть, другие могут прокомментировать, может ли включение ковариат в модель результата фактически поддерживать взаимозаменяемость, или можно ли предположить возможность обмена до включения ковариат в модель результата.


-3

Stat Methods Med Res. 2016 апр 19.

Оценка смещения в скорректированных по шкале склонностей нелинейных регрессионных моделях.

Методы оценки склонности обычно используются для корректировки наблюдаемого смешивания при оценке эффекта условного лечения в обсервационных исследованиях. Эмпирически показано, что один популярный метод - ковариатная корректировка показателя склонности в регрессионной модели - в нелинейных моделях смещен. Однако убедительная теоретическая причина не была представлена. Мы предлагаем новую структуру для исследования предвзятости и согласованности эффектов лечения, скорректированных по баллу склонности, в нелинейных моделях, в которых используется простой геометрический подход для установления связи между непротиворечивостью оценки балла предрасположенности и разрушаемостью нелинейных моделей. В рамках этой системы мы демонстрируем, что корректировка показателя склонности в модели результата приводит к разложению наблюдаемых ковариат на показатель склонности и остаточный член. Пропуск этого остаточного члена из модели неразборной регрессии приводит к предвзятым оценкам отношения условных шансов и отношения условных рисков, но не для отношения условных ставок. Кроме того, с помощью имитационных исследований мы показываем, что смещение в этих оценочных показателях, скорректированных на оценку предрасположенности, увеличивается с увеличением размера эффекта лечения, больших ковариатных эффектов и возрастающей разницы между коэффициентами ковариат в модели лечения и моделью результата.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.