Я постараюсь дать вам интуитивное понимание с минимальным акцентом на математике.
Основная проблема, связанная с данными наблюдений и вытекающими из этого анализами, вызывает недоумение. Смешение возникает, когда переменная влияет не только на назначенное лечение, но и на результаты. Когда проводится рандомизированный эксперимент, субъекты рандомизируются на лечение, так что в среднем субъекты, назначенные для каждого лечения, должны быть похожими по ковариатам (возраст, раса, пол и т. Д.). В результате этой рандомизации маловероятно (особенно в больших выборках), что различия в результате обусловлены какими-либо ковариатами, но обусловлены применяемым лечением, поскольку в среднем ковариаты в группах лечения одинаковы.
С другой стороны, с данными наблюдений не существует случайного механизма, который бы назначал субъектов для лечения. Возьмем, к примеру, исследование для изучения показателей выживаемости пациентов после новой операции на сердце по сравнению со стандартной хирургической процедурой. Как правило, по этическим причинам нельзя рандомизировать пациентов для каждой процедуры. В результате пациенты и врачи самостоятельно выбирают один из методов лечения, часто по ряду причин, связанных с их ковариатами. Например, новая процедура может быть несколько более рискованной, если вы старше, и в результате врачи могут рекомендовать новое лечение чаще молодым пациентам. Если это произойдет, и вы посмотрите на показатели выживаемости, новое лечение может показаться более эффективным, но это может ввести в заблуждение, поскольку более молодым пациентам было назначено это лечение, а более молодые пациенты, как правило, живут дольше, при прочих равных условиях Это где оценки склонности пригодятся.
Оценки склонности помогают решить фундаментальную проблему причинно-следственной связи: у вас могут возникнуть проблемы из-за нерандомизации субъектов к лечению, и это может быть причиной "эффектов", которые вы видите, а не только вмешательства или лечения. Если бы вы смогли как-то изменить свой анализ так, чтобы ковариаты (скажем, возраст, пол, пол, состояние здоровья) были «сбалансированы» между группами лечения, у вас были бы убедительные доказательства того, что разница в результатах обусловлена вмешательством / лечением а не эти ковариаты. Оценки склонности определяют вероятность того, что каждому субъекту будет назначено лечение, которое он получил с учетом набора наблюдаемых коваритов. Если вы затем сопоставите эти вероятности (оценки склонности),
Вы можете спросить, почему не совпадают точно по ковариатам (например, убедитесь, что вы соответствуете 40-летним мужчинам с хорошим здоровьем в лечении 1 и 40-летним мужчинам с хорошим здоровьем при лечении 2)? Это прекрасно работает для больших выборок и нескольких ковариат, но это становится практически невозможным, когда размер выборки небольшой, а число ковариат даже умеренного размера (см. Проклятие размерности на Перекрестной проверке, почему это так) ,
Теперь, несмотря на все сказанное, ахиллесова пята оценки склонности - это предположение об отсутствии незамеченных противников. Это предположение гласит, что вы не ошиблись, включив в свою настройку какие-либо ковариаты, являющиеся потенциальными препятствиями. Интуитивно понятно, что причина этого заключается в том, что, если вы не включили собеседника при создании показателя склонности, как вы можете приспособиться к нему? Существуют также дополнительные допущения, такие как допущение о стабильной стоимости единицы лечения, в котором говорится, что лечение, назначенное одному субъекту, не влияет на потенциальный исход других субъектов.