В настоящее время я работаю над попыткой реализовать метод, используемый в популярной статье под названием «Я только что провел два миллиона регрессий». Основная идея заключается в том, что есть определенные случаи, когда не очевидно, какие элементы управления должны быть включены в модель. Одна вещь, которую вы можете сделать в этом случае, - это случайным образом нарисовать элементы управления, запустить миллионы различных регрессий, а затем посмотреть, как отреагировала ваша переменная интереса. Если он обычно имеет одинаковый знак во всех спецификациях, то мы можем считать его более устойчивым, чем переменная, знак которой всегда изменяется.
Большая часть бумаги очень понятна. Тем не менее, документ взвешивает все эти различные регрессии следующим образом: интегрированная вероятность данной спецификации делится на сумму всех интегрированных вероятностей для всех спецификаций.
Проблема, с которой я столкнулся, заключается в том, что я не уверен, как интегрированная вероятность связана с регрессиями OLS, которые я хотел бы запустить (в Stata). Гугл темы, такие как "stata интегрированная вероятность", оказались тупиковыми, поскольку я продолжаю сталкиваться с такими вещами, как логистическая регрессия со смешанными эффектами. Признаюсь, что эти модели слишком сложны для меня, чтобы понять.
Моя текущая работа заключается в том, что в литературе используются различные схемы взвешивания, которые я (вроде) понимаю. Например, можно взвешивать каждую регрессию на основе индекса отношения правдоподобия. Существует даже пакет R, который использует lri в качестве весов. Естественно, я хотел бы также реализовать оригинальный.
Любой совет?
Ссылка на документ: http://down.cenet.org.cn/upfile/34/2009112141315178.pdf