У меня есть продольные данные о людях, и некоторые из них подвергались лечению, а другие - нет. Все люди находятся в выборке от рождения до 18 лет, и лечение происходит в каком-то возрасте между этими интервалами. Возраст лечения может отличаться в разных случаях. Используя сопоставление баллов предрасположенности, я хотел бы сопоставить обработанные и контрольные единицы в парах с точным сопоставлением по году рождения, чтобы можно было отслеживать каждую пару с момента их рождения до 18 лет. В общей сложности насчитывается около 150 человек, получавших лечение, и 4000 человек, не получавших лечения. После сопоставления идея состоит в том, чтобы использовать стратегию различия в различиях для оценки эффекта лечения.
Проблема, с которой я сталкиваюсь на данный момент, заключается в сопоставлении данных панели. Я использую psmatch2
команду Stata, и я сопоставляю бытовые и индивидуальные характеристики с помощью сопоставления баллов склонности. В целом, с данными панели будут разные оптимальные совпадения в каждом возрасте. В качестве примера: если A лечится, B и C являются контрольными, и все они родились в 1980 году, то A и B могут совпадать в 1980 году в возрасте 0 лет, тогда как A и C сравниваются в 1981 году в возрасте 1 года и т. Д. , Также А может быть сопоставлен с его собственными значениями предварительной обработки за предыдущие годы.
Чтобы обойти эту проблему, я взяла среднее значение всех переменных во времени, так что сопоставление может идентифицировать лиц, которые в среднем наиболее похожи по продолжительности выборки, и я сопоставляю отдельно для каждой возрастной группы от 0 до 18 лет. К сожалению, это по-прежнему соответствует различным единицам управления для каждой единицы лечения в возрастной группе.
Если бы кто-то мог направить меня к методу для парного сопоставления с данными панели в Stata, это было бы очень ценно.