Почему использование данных поперечного сечения для вывода / прогнозирования продольных изменений - это плохо?


11

Я ищу бумагу, которая, я надеюсь, существует, но не знаю, есть ли она. Это может быть набор тематических исследований и / или аргумент из теории вероятностей о том, почему использование данных поперечного сечения для выведения / прогнозирования продольных изменений может быть плохой вещью (т.е. это не обязательно так, но может быть).

Я видел ошибку, сделанную несколькими серьезными способами: были сделаны выводы, что, поскольку более богатые люди в Британии путешествуют больше, тогда, когда общество становится богаче, население в целом будет путешествовать больше. Этот вывод оказался неверным в течение длительного периода - более десяти лет. И аналогичная картина с использованием электроэнергии в домашних условиях: данные поперечного сечения подразумевают значительное увеличение доходов, которые не проявляются с течением времени.

Происходит несколько вещей, включая когортные эффекты и ограничения со стороны предложения.

Было бы очень полезно иметь единый справочник, который бы собирал подобные тематические исследования; и / или использовали теорию вероятностей, чтобы проиллюстрировать, почему использование данных поперечного сечения для выведения / прогнозирования продольных изменений может быть очень очень обманчивым.

Существует ли такая бумага, и если да, то что это?


2
Я полагаю, что экономисты думают об этих явлениях как об общем эффекте равновесия. Статистики называют это нарушением допущения о значении стабильного лечения. Я думаю, что проблема панели и поперечного сечения - это нечто вроде красной селедки.
Дмитрий Владимирович Мастеров

Ответы:


2

Вы частично отвечаете на свой вопрос, запрашивая «продольные» изменения. Данные сечения называются потому, что они делают мгновенный снимок, буквально сечение, вырезанное из эволюционирующего во времени общества с его многочисленными взаимосвязями. Поэтому лучший вывод, на который вы можете надеяться, заключается в предположении, что все, что вы изучаете, не зависит от времени или, по крайней мере, завершило свою эволюцию.

С другой стороны, данные, которые вы ищете, являются продольными или панельными данными для экономистов.

Хорошая ссылка, которая объясняет в основном методы, но также выделяет два ярких примера из экономики, здесь . В примере 2.1 представлены инвестиционные ставки компании.

Раздел 3 является немного более теоретическим, но содержит много понимания: модель данных панели может быть

yi,t=αyi,t1+xi,tγ+ηi+vi,t.

Теперь этот тип модели может охватить зависимость от государства, которая (наряду с ненаблюдаемой неоднородностью) является общим объяснением того, почему люди ведут себя по-разному. Поэтому, если вы наблюдаете только за тем, как люди путешествуют в определенный момент времени, ваша будет неопознанной, то есть вы не будете знать, насколько их вчерашнее путешествие повлияло на их решение снова путешествовать.α

Теперь отключите временную зависимость, но имейте в виду, что это уравнение, вероятно, было истинной моделью.

В модели сечения сейчас вы бы полностью отбросили индекс потому что у вас есть данные только за один период. Следовательно, у вас также нет возможности учесть тот факт, что у каждого человека в вашем наборе данных могут быть совершенно разные значения , что смещает ваши регрессии в целом вверх, по крайней мере, когда истинная модель является динамичной. Вероятно, это является причиной завышения из-за ненаблюдаемого индивидуального эффекта (может быть и обычным), который вы не измеряли, но который был отражен в вашем перекрестном исследовании.tηis

Теперь введите данные панели еще раз. То, что мы можем сделать, это вычесть среднее значение по времени для каждой переменной, которое, учитывая, что значение является постоянным во времени, исключило бы этот термин. Эта трансформация (возможны другие) позволяет вам сосредоточиться только на динамике (и фактически вы потеряете любые не зависящие от времени регрессоры).ηi

Теперь это главное отличие данных поперечного сечения и панели. Тот факт, что вы можете устранить эффект, не зависящий от времени, потому что у вас есть это изменение во времени, позволяет вам устранить определенные отклонения, которые оценка поперечного сечения не позволяет вам обнаружить. Поэтому, прежде чем задуматься об изменении политики, например о повышении налога на поездки, потому что вы ожидаете, что люди будут путешествовать, и вы хотите получать больше государственных доходов, более полезно увидеть это явление в течение нескольких лет, чтобы вы могли быть уверены, что вы не захват ненаблюдаемой неоднородности в вашем образце, который вы интерпретируете как склонность к путешествию.

Чтобы оценить эти модели, лучше всего пройти по ссылке. Но будьте осторожны: разные предположения о поведении людей сделают разные процедуры оценки допустимыми или нет.

Надеюсь, это поможет!


1

Это очень похоже на определение неэргодического процесса (меры над реализациями не равны мерам во времени). К сожалению, очень мало интересных явлений реального мира являются эргодическими. Я полагаю, что это может быть причиной более тонкой выборки и вывода, где могут быть выполнены определенные упрощения. Я думаю о примерах небольших временных или пространственных масштабов, где хаотическое поведение не наблюдается, поэтому предикторы могут быть линеаризованы. Но я просто болтаю здесь .. Боюсь, я не могу помочь вам с конкретной литературой по этой теме. Извините: / Но интересный вопрос, тем не менее

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.