Это пример того, что статистик Эндрю Гельман называет «ошибкой контроля за промежуточным результатом». Вот его описание этой ошибки, которая появляется, когда исследователи спрашивают, меняет ли ваша дочь больше вашей политики. Решение иметь второго ребенка обязательно зависит от предыдущего решения о рождении первого ребенка, и, таким образом, кажется ясным примером контроля за переменной решения, которая была эндогенной.
В последние несколько лет было проведено несколько исследований, посвященных экономическим решениям родителей сыновей по сравнению с родителями дочерей ... Общей чертой всех этих исследований является то, что они контролируют общее количество детей ... На первый взгляд, контроль за общим количеством детей кажется разумным. Однако существует трудность, заключающаяся в том, что общее число детей является промежуточным результатом, и контроль за ним (будь то путем поднабора данных, основанных на #kids или использования #kids в качестве контрольной переменной в регрессионной модели) может сместить оценку причинного эффекта наличия сына (или дочери).
Чтобы увидеть это, предположим (гипотетически), что политически консервативные родители с большей вероятностью хотят иметь сыновей, и если у них есть две дочери, они (гипотетически) с большей вероятностью будут пытаться найти третьего ребенка. Для сравнения, либералы чаще останавливаются на двух дочерях. В этом случае, если вы посмотрите на данные о семьях с 2 дочерьми, консерваторы будут недопредставлены, и эти данные могут показать корреляцию дочерей с политическим либерализмом - даже если наличие дочерей не имеет никакого эффекта! ...
Решение заключается в применении стандартного консервативного (в статистическом смысле!) Подхода к причинно-следственной связи, который заключается в регрессии в вашей переменной лечения (пол ребенка), но контролирует только то, что происходит до рождения ребенка. Например, можно сравнить родителей, у которых первый ребенок - девочка, с родителями, у которых первый ребенок - мальчик. Можно также взглянуть на второе рождение, сравнивая родителей, у которых второй ребенок - девочка, с теми, чей второй ребенок - мальчик, контролируя пол первого ребенка. И так далее для третьего ребенка и т. Д.
Наличие сыновей делает вас более консервативным? Может быть, а может и нет. Проблема с контролем промежуточного результата
Что касается вашего комментария: «Не указывайте эти переменные управления, и они сами приводят к пропускам смещения переменных», похоже, это зависит от того, какой инструмент вы получите. Хороший инструмент, который действительно удовлетворяет требованиям, должен быть независимым от термина ошибки на втором этапе и независимым от всего, что вы контролируете напрямую . То есть инструмент меняет Y только через X. Таким образом, подходящий инструмент для неравенства должен быть независим от роста и развития (удачи в этом!), Если мы считаем, что уравнение насилия является структурным уравнением насилия.