Каковы основные философские, методологические и терминологические различия между эконометрикой и другими статистическими областями?

70

Эконометрика имеет существенное совпадение с традиционной статистикой, но часто использует свой собственный жаргон на различные темы («идентификация», «экзогенный» и т. Д.). Однажды я услышал от профессора по прикладной статистике в другой области комментарий, что часто терминология отличается, но концепции совпадают. Тем не менее, он также имеет свои собственные методы и философские различия (на ум приходит знаменитое эссе Хекмана).

Какие терминологические различия существуют между эконометрикой и основной статистикой, и где поля расходятся, чтобы стать разными не только в терминологии?

econometrics terminology

— Ари Б. Фридман
источник

96

Существуют некоторые терминологические различия, когда одно и то же называется разными именами в разных дисциплинах:

Продольные данные в биостатистике - это повторные наблюдения одних и тех же людей = панельные данные в эконометрике.
$1/(1+\exp[-x'\beta])$ $x$
$M$

Существуют терминологические различия, когда один и тот же термин используется для обозначения разных вещей в разных дисциплинах:

$x'\beta$
Надежный вывод означает, что стандартные ошибки с поправкой на гетероскедастичность для экономистов (с расширениями на кластерные стандартные ошибки и / или стандартные ошибки с поправкой на автокорреляцию) и методы, устойчивые к значительным отклонениям для статистиков.
Кажется, что экономисты имеют нелепую идею о том, что стратифицированные выборки - это те, в которых вероятности отбора варьируются между наблюдениями. Их следует называть выборками с неравной вероятностью. Стратифицированные выборки - это выборки, в которых популяция разбита на заранее определенные группы в соответствии с характеристиками, известными до проведения выборки.
«Добыча данных» эконометриками (по крайней мере, в литературе 1980-х годов) означала множественное тестирование и связанные с ним подводные камни, которые были чудесно объяснены в книге Харрелла . Процедуры интеллектуального анализа данных ученых-компьютерщиков (и статистиков) представляют собой непараметрические методы поиска закономерностей в данных, также известные как статистическое обучение .

Я рассматриваю уникальный вклад эконометрики в

Способы борьбы с эндогенностью и плохо определенными регрессионными моделями, признавая, как mpiktas объяснил в другом ответе , что (i) объясняющие переменные могут сами быть случайными (и, следовательно, коррелировать с ошибками регрессии, приводящими к смещению в оценках параметров), (ii) модели могут страдать от пропущенных переменных (которые затем становятся частью термина ошибки), (iii) может наблюдаться неоднородность того, как экономические агенты реагируют на стимулы, что усложняет стандартные регрессионные модели. Angrist & Pischke - это замечательный обзор этих проблем, и статистики узнают много нового о том, как сделать из этого регрессионный анализ. По крайней мере, статистики должны изучать и понимать регрессию инструментальных переменных.
$\chi^2$ $s^2 (X'X)^{-1}$
Во временной области было проделано много работы с равномерно распределенными процессами - вот как собираются макроэкономические данные. Уникальный вклад включает интегрированные и коинтегрированные процессы и методы авторегрессии с условной гетероскедастичностью ((G) ARCH). Будучи в целом микро-человеком, я менее знаком с этим.

$\beta/\sigma$ $\sigma$ говорят, конечно, экономисты.) Конечно, линейная полезность полезности - это очень забавная вещь с точки зрения микроэкономики 101, хотя некоторые обобщения на полукогнутые функции, вероятно, сделаны в Mas-Collel.

$C_p$ , DFBETA и т. Д.), Анализ пропущенных данных (частичная идентификация Мански, безусловно, причудливая, но основной анализ MCAR / MAR / NMAR и множественное вменение более полезны), а также статистика обследования. Многие другие вклады основных статистических данных были приняты эконометрикой и либо приняты в качестве стандартной методологии, либо приняты в качестве краткосрочного метода: модели ARMA 1960-х годов, вероятно, лучше известны в эконометрике, чем в статистике, поскольку некоторые программы для выпускников вузов в статистике может не предложить курс временных рядов в эти дни; оценки усадки / регрессия гребня 1970-х годов приходили и уходили; бутстрап 1980-х годов - реакция коленного толчка для любых сложных ситуаций, хотя экономисты должны быть лучше осведомлены об ограничениях бутстрапа; эмпирическая вероятность 1990-х годов была более развитой в методологии теоретических эконометристов, чем теоретиков-статистиков; вычислительные байесовские методы 2000-х годов используются в эконометрике, но мне кажется, что они слишком параметрические, слишком основанные на моделях, чтобы быть совместимыми с парадигмой надежности, о которой я упоминал ранее. Находят ли экономисты какое-либо использование статистического обучения / биоинформатики или пространственно-временных материалов, которые чрезвычайно популярны в современной статистике, остается открытым.

— Stask
источник

14

+1 Это прекрасный пример того, какие замечательные ответы могут возникнуть, когда вопрос открыт для разнообразного сообщества.

— whuber

1

@whuber, спасибо за комментарий. Откровенно говоря, дисциплинарные разногласия сводят меня с ума.

— StasK

@StasK Отличный ответ. Один быстрый момент, хотя. «В целом, экономисты склонны искать строгую интерпретацию коэффициентов в своих моделях». Строго говоря, это немного ошибочно, так как в анализе VAR (который очень популярен, поэтому ваше утверждение не следует говорить в терминах «общего»), центральная точка находится в интерпретации функций импульсного отклика, а не в интерпретации коэффициентов модели (часто они слишком сложны, чтобы пытаться их интерпретировать).

— Грэм Уолш

@GraemeWalsh - я вижу, как я уже сказал, я не работаю в макро / временных рядах. Спасибо за указание на это.

— StasK

20

Лучше всего это объяснить с помощью линейной регрессии, поскольку она является основным инструментом эконометрики. В линейной регрессии у нас есть модель:

Y = X β + ε

$Y=X\beta+\varepsilon$

$X$

Другой способ взглянуть на разницу состоит в том, что данные в других полях статистики можно рассматривать как выборку iid. В эконометрике данные во многих случаях являются выборкой из стохастического процесса, из которых iid является лишь частным случаем. Отсюда опять другой жаргон.

Знания вышеупомянутого обычно достаточно, чтобы легко перейти от других статистических полей к эконометрике. Поскольку обычно дается модель, нетрудно понять, что к чему. По моему личному мнению, различие жаргона между машинным обучением и классической статистикой намного больше, чем между эконометрикой и классической статистикой.

Обратите внимание, что есть термины, которые имеют запутанный смысл в статистике без эконометрики. Главный пример - фиксированные и случайные эффекты. Статьи Википедии об этих терминах - беспорядок, смешивающий эконометрику со статистикой.

— mpiktas
источник

5

«Ярким примером являются фиксированные и случайные эффекты. Статьи Википедии об этих терминах - беспорядок, смешивающий эконометрику со статистикой». Это точно.

— Майкл Бишоп

8

Одно тонкое отличие состоит в том, что экономисты иногда приписывают значение ошибочным терминам в моделях. Это особенно верно среди «структурных» экономистов, которые считают, что вы можете оценить структурные параметры, которые представляют интерес или индивидуальную неоднородность.

Классный пример этого - пробит. Хотя статистики, как правило, не знают, что является причиной ошибки, экономисты часто рассматривают ошибки в регрессиях как представляющие неоднородность предпочтений. Для пробного случая вы могли бы смоделировать решение женщины присоединиться к рабочей силе. Это будет определяться различными переменными, но термин ошибки будет представлять ненаблюдаемую степень, в которой индивидуальные предпочтения для работы могут варьироваться.

— d_a_c321
источник

4

Хотя статистики могут быть не осведомлены о причинах ошибки, это не значит, что они не заботятся об этом. То, что вы описываете, является неоднородностью термина ошибки, что означает, что обычные предположения о терминах ошибки не выполняются. Ни один статистик не проигнорирует это.

— mpiktas

2

Интересно, что в этом случае проблем с формой ошибки нет. Статистики и экономисты одинаково встанут в руки и будут беспокоиться о гетероскедастичности или любых других неидеальных ошибках. Однако, даже если погрешность N (0,1), как в пробите, экономисты склонны дать ей экономическую интерпретацию.

— d_a_c321

5

Это относится к моделированию в целом. Насколько мне известно, интерпретация модели по-своему не ограничивается экономистами.

— mpiktas

Я не согласен. Экономисты явно имеют монополию на умную интерпретацию моделей <шучу!>. Хороший вопрос, хотя.

— d_a_c321

8

Конечно, любые широкие заявления должны быть слишком широкими. Но мой опыт показывает, что эконометрика обеспокоена причинно-следственными связями, а статистика стала больше интересоваться прогнозированием.

С экономической точки зрения вы не можете избежать литературы о «революции правдоподобия» (в основном эконометрическая эконометрика и т. Д.). Экономисты сосредоточены на влиянии некоторых видов лечения на некоторые результаты с целью оценки политики и рекомендаций.

Что касается статистики, вы видите, что рост интеллектуального анализа данных / машинного обучения с приложениями к онлайн-аналитике и генетике является ярким примером. Здесь исследователи больше заинтересованы в прогнозировании поведения или отношений, а не в точном их объяснении; они ищут модели, а не причины.

Я также хотел бы отметить, что статистики традиционно больше интересовались дизайном экспериментов, возвращаясь к сельскохозяйственным экспериментам в 1930-х годах.

— Чарли
источник

7

Я заметил, что по сравнению с тем, что я бы назвал экономистами-статистиками, экономисты, похоже, неохотно используют графики, как схематические, так и основанные на данных. Охват регрессии, которая, естественно, даже более важна в эконометрике, чем где-либо еще, является важным примером. Современные введения в регрессию со стороны статистиков подчеркивают всю значимость построения данных и построения результатов регрессии, включая диагностические графики, тогда как лечение в текстах по эконометрике является явно более формальным. Ведущие тексты в эконометрике не содержат много графиков и не сильно продвигают их значение.

Трудно проанализировать это без риска казаться недипломатичным или хуже, но я бы предположил, что некоторые из перечисленных ниже факторов могут помочь.

Желание строгости. Эконометрики склонны к подозрению или враждебности к изучению данных и настоятельно предпочитают, чтобы решения основывались на формальных тестах (всякий раз, когда они не выходят из теоремы). Это связано с предпочтением того, чтобы модели основывались на «теории» (хотя это может означать, что предсказатель был упомянут ранее в статье неким экономистом, не говорящим о данных).
Практика публикации. Бумаги для экономических журналов или журналов по эконометрике имеют большой объем стилизованных таблиц коэффициентов, стандартных ошибок, t-статистики и P-значений. Во многих случаях даже кажется, что о добавлении графиков даже не думают, и, если они будут предложены, рецензенты, возможно, предложат их сократить. Эти практики стали внедряться в течение поколения или более в той степени, в которой они стали автоматическими, с жесткими соглашениями о главных уровнях значимости и т. Д.
Графика для сложных моделей. Молчаливые графики игнорируются всякий раз, когда кажется, что существует граф, который соответствует сложной модели со многими предикторами и т. Д. И т. Д. (Что действительно часто бывает трудно решить).

Естественно, то, что я предлагаю, это как бы различие в средствах, и я признаю большую изменчивость в обоих случаях.

— Ник Кокс
источник

4

В отличие от большинства других количественных дисциплин, экономика имеет дело с маржой. То есть предельная полезность, предельная норма замещения и т. Д. С точки зрения исчисления экономика имеет дело с «первым» (и производными более высокого порядка).

Многие статистические дисциплины имеют дело с непроизводными величинами, такими как средние и дисперсии. Конечно, вы можете пойти в область предельных и условных распределений вероятностей, но некоторые из этих приложений также идут в экономику (например, «ожидаемое значение»).

— Том Ау
источник

2

Это не эконометрика, это контекст. Если ваша функция правдоподобия не имеет уникального оптимума, она будет касаться как статистики, так и эконометрика. Теперь, если вы предлагаете предположение, которое исходит из экономической теории и ограничивает параметризацию так, чтобы параметр был идентифицирован, его можно было бы назвать эконометрикой, но предположение могло бы исходить из любой предметной области.

Экзогенность - это философский вопрос. См., Например, http://andrewgelman.com/2009/07/disputes_about/ для сравнения различных точек зрения, где экономисты обычно понимают это так, как Рубин.

Итак, короче говоря, либо примите жаргон, который использует ваш учитель, либо держите себя открытым и читайте широко.

— Alex
источник

2

Эконометрики почти исключительно заинтересованы в причинно-следственной связи, в то время как статистики также используют модели для прогнозирования результатов. В результате эконометрики больше внимания уделяют экзогенности (как уже упоминали другие). Эконометрики приведенной формы и структурные эконометрики по-разному воспринимают эту причинную интерпретацию.

Эконометрики с уменьшенной формой часто имеют дело с экзогенностью, используя методы инструментальных переменных (в то время как статистиками IV используется гораздо реже).

Структурные эконометрики получают причинную интерпретацию параметров, полагаясь на теорию, которая редко встречается в статистике.

— DanB
источник

1

IV часто используется не статистиками, а эконометрика в уменьшенной форме использует множество методов для причинного вывода, отличных от только IV (diff-in-diff, разрыв регрессии и т. Д.). См. Эту статью Imbens для согласования эконометрики IV с недавними неэконометрическими статистическими исследованиями IV.

— Ари Б. Фридман

2

Как статистик, я думаю об этом в более общих чертах. У нас есть биометрия и эконометрика. Это обе области, где статистика используется для решения проблем. С биометрией мы имеем дело с биологическими / медицинскими проблемами, тогда как эконометрика имеет дело с экономикой. В противном случае они будут одинаковыми, за исключением того, что разные дисциплины подчеркивают разные статистические методы. В биометрическом анализе выживаемости и таблицы непредвиденных обстоятельств широко используются. Для эконометрики активно используется временной ряд. Регрессионный анализ является общим для обоих. Увидев ответы о терминологических различиях между эконометрикой и биостатистикой, кажется, что реальный вопрос был в основном о терминологии, и я действительно только обратился к двум другим. Ответы настолько хороши, что я ничего не могу к этому добавить. Мне особенно понравились ответы StasK. Но, как биостатист, я думаю, что мы используем модель логита и модель логистики взаимозаменяемо. Мы называем log (p / [1-p]) преобразованием logit.

— Майкл Черник
источник

2

(+1) Вы можете добавить психометрию в список прикладных статистических данных, относящихся к конкретным областям, для решения проблем, специфичных для конкретных областей.

— Энди Вт