Определение и разграничение регрессионной модели


13

Смущающий простой вопрос - но, кажется, его не задавали на Cross Validated раньше:

  1. Каково определение модели регрессии?

Также вопрос поддержки,

  1. Чем не модель регрессии?

Что касается последнего, меня интересуют хитрые примеры, где ответ не сразу очевиден, например, ARIMA или GARCH.

Ответы:


9

Я бы сказал, что «модель регрессии» является своего рода мета-концепцией, в том смысле, что вы не найдете определения «модели регрессии», но есть более конкретные понятия, такие как «линейная регрессия», «нелинейная регрессия», "устойчивая регрессия" и так далее. Это так же, как в математике, мы обычно определяем не «число», а «натуральное число», «целые числа», «действительное число», «р-адическое число» и т. Д., И если кто-то захочет включить кватернионы среди чисел, пусть будет так! на самом деле не имеет значения, какое значение имеет то, какие определения использует книга / статья, которую вы читаете в данный момент.

Определения являются инструментами , а эссенциализм, который обсуждает, в чем суть ..., что на самом деле означает слово , редко имеет смысл.

Итак, что отличает «регрессионную модель» от других видов статистических моделей? В основном, это переменная ответа , которую вы хотите смоделировать под влиянием (или определяемым) некоторого набора переменных-предикторов . Нас не интересует влияние на другое направление, и нас не интересуют отношения между переменными предиктора. В основном, мы берем переменные предиктора как данные и рассматриваем их как константы в модели, а не как случайные переменные.

Упомянутые выше отношения могут быть линейными или нелинейными, заданными параметрическим или непараметрическим способом и так далее.

Чтобы выделить из других моделей, нам лучше взглянуть на некоторые другие слова, часто используемые для обозначения чего-то другого для «моделей регрессии», таких как «ошибки в переменных», когда мы принимаем возможность ошибок измерения в переменных предиктора. Это вполне может быть включено в мое описание «регрессионной модели» выше, но часто рассматривается как альтернативная модель.

Кроме того, что подразумевается, может варьироваться между полями, см. В чем разница между условием на регрессоры и обработки их как фиксированные?

Повторюсь: важно то определение, которое используют авторы, которого вы сейчас читаете, а не какая-то метафизика о том, что это «на самом деле».


1
Я согласен с сутью вашего ответа. Мой вопрос был мотивирован тем, что я столкнулся с утверждениями о регрессионных моделях, которые заставили меня задуматься о том, к чему это утверждение действительно относится (и к чему оно не относится). Конечно, теперь вы могли бы сказать: «Прислушайтесь к своему усмотрению и тщательно проверьте детали», но иногда я мог бы сразу отказаться от предположенного утверждения, сказав, что оно не соответствует действительности в целом (возможно, верно только в очень конкретном случае). , Тогда мне нужно определение для ссылки. Конечно, есть и такие ситуации, в которых полезно точное определение.
Ричард Харди

1
Затем вы должны задать конкретные вопросы о тех видах использования, с которыми вы столкнулись, со ссылками.
kjetil b halvorsen

2
Я не собираюсь быть разборчивым, но подумайте об этом: кто-то спрашивает вас, что вы делаете, вы говорите: «Я анализирую / прогнозирую / тестирую [что-то] с использованием регрессионных моделей». - «Что такое модель регрессии?» - (Тишина). Или ситуация во вводном эконометрическом классе: «Профессор, что такое регрессионная модель?» -- (Нет ответа). Я думаю, что это очень естественные вопросы, поэтому было бы неплохо получить ответ.
Ричард Харди

2
Да, было бы неплохо получить ответ, но я не уверен, что есть один канонический ответ, с которым все могут согласиться. Я получил совершенно другое представление о регрессии из статистической книги, такой как Seber: «Анализ линейной регрессии», как из текста по эконометрике. Но с некоторыми идеями можно согласиться. Я думаю, это действительно семейство моделей. Тогда мы можем спросить, что является общим ядром всех этих моделей.
kjetil b halvorsen

1
Возможно, вас заинтересует смежный мой вопрос: определение простой модели линейной регрессии .
Ричард Харди

7

Два хороших ответа уже были даны, но я хотел бы добавить свои два цента.

YX1,,XkY

μ=E(y|x1,,xk)=f(x1,,xk)

fμμL1μ

Y . Это упрощение является ключевой особенностью регрессионных моделей.


Благодарю. Интуиция не повредит, хотя я ищу более формальное определение, которое я мог бы бросить на кого-то, кто спросил меня, так что же такое модель регрессии в любом случае? а затем попытался выбрать детали.
Ричард Харди

@RichardHardy Я думаю , что это ключевая особенность моделей регрессии , которая разделяется всеми из них.
Тим

3
y

2

Некоторые мысли, основанные на литературе:

Ф. Хаяси в главе 1 своего классического учебника для выпускников "Эконометрика" (2000) утверждает, что следующие предположения составляют классическую модель линейной регрессии:

  1. линейность
  2. Строгая экзогенность
  3. Нет мультиколлинеарности
  4. Сферическая ошибка дисперсии
  5. «Фиксированные» регрессоры

Вулдридж в главе 2 своего классического вводного учебника по эконометрике «Вводная эконометрика: современный подход» (2012) утверждает, что следующее уравнение определяет простую модель линейной регрессии:

y=β0+β1x+u.

Грин в главе 2 своего популярного учебника по эконометрике «Эконометрический анализ» (2011) утверждает

Классическая модель линейной регрессии состоит из ряда предположений о том, как набор данных будет создаваться базовым «процессом генерирования данных».

и впоследствии дает список предположений, аналогичных предположениям Хаяси.

Что касается интереса ФП к модели GARCH, Боллерслев «Обобщенная авторегрессионная условная гетероседастичность» (1986) включает фразу «модель регрессии GARCH» в заголовок раздела 5, а также в первое предложение этого раздела. Так что отец модели GARCH не возражал называть GARCH моделью регрессии.


1
Yf(X,β)

Правда, мои примеры для моделей линейной регрессии; это то, что я смог найти в надежных источниках, таких как эти учебники, которые широко используются и стали классикой. Я не очень доверяю Википедии по статистическим и эконометрическим вопросам. Во всяком случае, даже в Википедии есть глава «Базовые предположения», которая похожа на то, что я привел в учебниках. Что касается другого поста, не могли бы вы опубликовать соответствующую часть вашего комментария там, чтобы я мог ответить там? В этом посте я ничего не говорил о скрытых переменных моделях, но приятно услышать ваше мнение.
Ричард Харди

3
Почему пункт 3 «нет мультиколлинеарности»? Я никогда не видел, чтобы это использовалось в качестве предположения в доказательстве какого-то результата!
kjetil b halvorsen

1
@kjetilbhalvorsen, пожалуйста, не считайте меня ответственным за то, что написано в учебнике, автором которого я не являюсь. Но спасибо за комментарий, конечно, и даже больше за ответ!
Ричард Харди
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.