В чем проблема использования R-квадрата в моделях временных рядов?

Я читал, что использование R-квадрата для временных рядов не подходит, потому что в контексте временных рядов (я знаю, что существуют другие контексты) R-квадрат больше не уникален. Почему это? Я пытался найти это, но я ничего не нашел. Обычно я не придаю особого значения R-квадрату (или скорректированному R-квадрату), когда оцениваю свои модели, но многие мои коллеги (например, бизнес-мажоры) абсолютно влюблены в R-квадрат и я хочу иметь возможность объясните им, почему R-Squared не подходит в контексте временных рядов.

regression time-series r-squared

— мммммммммм
источник

Поиск в Google: «ложная регрессия в эконометрике». Или посмотрите статью Грейнджер и Ньюболд . Другие могут предоставить более подробную информацию в ответах.

— Грэм Уолш

@Richard Hardy, не могли бы вы пояснить: «Если мы возьмем выборку R2 в качестве показателя ее популяции, она разбивается на интегрированные временные ряды».

— Сиддхарт Кришнамурти

Некоторые аспекты проблемы:

Если кто-то дает нам вектор чисел и согласованную матрицу чисел , нам не нужно знать, каково отношение между ними, чтобы выполнить некоторую алгебру оценки, рассматривая как зависимую переменную. Алгебра будет возникать независимо от того, представляют ли эти числа данные поперечного сечения, временные ряды или данные панели, или содержит ли матрица запаздывающие значения и т. Д. $\mathbf y$ $\mathbf X$ $y$ $\mathbf X$ $y$

Фундаментальным определением коэффициента детерминации является $R^2$

р^{2} знак равно 1 - \frac{S S_{р е s}}{S S_{T о T}}

$R^2 = 1 - \frac {SS_{res}}{SS_{tot}}$

где - сумма квадратов невязок из некоторой процедуры оценки, а - сумма квадратов отклонений зависимой переменной от ее выборочного среднего. $SS_{res}$ $SS_{tot}$

При объединении всегда будет однозначно рассчитываться для конкретной выборки данных, конкретной формулировки отношения между переменными и конкретной процедуры оценки, при условии, что процедура оценки такова, что она обеспечивает точечные оценки вовлеченные неизвестные величины (и, следовательно, точечные оценки зависимой переменной и, следовательно, точечные оценки невязок). Если какой-либо из этих трех аспектов изменится, арифметическое значение в целом изменится, но это верно для любого типа данных, а не только для временных рядов. $R^2$ $R^2$

$R^2$ $R^2$ $R^2$

$R^2$

$R^2$ $R^2$ бездонные предсказания вне выборки.

Интуитивно понятно, что этот, возможно, противоречащий интуитивному компромиссу, происходит потому, что, фиксируя всю изменчивость зависимой переменной в оценочном уравнении, мы превращаем несистематическую изменчивость в систематическую с точки зрения прогнозирования (здесь «бессистемный» следует понимать относительно наших знаний - с чисто детерминистской философской точки зрения не существует такой вещи, как «бессистемная изменчивость». Но в той степени, в которой наше ограниченное знание заставляет нас рассматривать некоторую изменчивость как «бессистемную», тогда попытка, тем не менее, превратить ее в систематическую компонент, приносящий предсказание катастрофы).

$R^2$ $R^2\approx 1$

— Алекос Пападопулос
источник

Хорошее объяснение, но почему это добавлено в качестве стандартного вывода программного обеспечения в статистическом пакете

@brijesh Регресс-традиция, я бы сказал.

— Алекос Пападопулос

R^{2}

$R^2$