Являются ли остатки «прогнозируемыми минус фактическими» или «фактическими минус прогнозируемыми»


46

Я видел, что «остатки» по-разному определяются как «прогнозируемые минус фактические значения» или «фактические минус прогнозируемые значения». В целях иллюстрации, чтобы показать, что обе формулы широко используются, сравните следующие результаты веб-поиска:

На практике это почти никогда не имеет значения, так как знак невязочных остатков обычно не имеет значения (например, если они возведены в квадрат или взяты абсолютные значения). Тем не менее, мой вопрос таков: считается ли одна из этих двух версий (сначала предсказание против фактической сначала) «стандартной»? Мне нравится быть последовательным в моем использовании, поэтому, если есть общепризнанный общепринятый стандарт, я бы предпочел следовать ему. Однако, если нет стандарта, я с радостью приму это как ответ, если это будет убедительно продемонстрировано, что стандартного соглашения не существует.


8
Поскольку невязка связана с ошибкой модели, когда мы пишем y=a+bx+ϵ это заставляет нас думать, что y - это «фиксированная часть» плюс «случайная часть», поэтому невязка является y минус a+bx .
AdamO

Прогнозируемый минус фактический или фактический минус прогнозируемый будет ошибкой прогнозирования (или ее отрицательной величиной), в то время как подобранный минус фактический или фактический минус установленный будет остаточным (или его отрицательным значением). Ответ Стивена Коласса упоминает ошибки прогноза по причине.
Ричард Харди

Я считаю (прогнозируемым-актуальным) удобнее работать с. Часто вам нужно вычислить производные остатка по некоторым параметрам. Если вы используете (с фактическим прогнозом), то появляются знаки минус, что вы должны следить за остальными вашими вычислениями, что требует использования большего количества круглых скобок, исключения двойных отрицательных значений при их возникновении и т. Д. По моему опыту, это приводит к большему количеству ошибок
Ник Алджер

Ответы:


43

Остатки всегда фактические минус прогнозируемые. Модели: Следовательно, остатки е , которые являются оценками погрешности ε : ε = у - у

y=f(x;β)+ε
ε^ε
ε^=yy^y^=f(x;β^)

Я согласен с @whuber, что этот знак не имеет математического значения. Просто хорошо иметь конвенцию. И нынешняя конвенция такая же, как в моем ответе.

Поскольку ОП оспаривает мои полномочия по этому вопросу, я добавляю несколько ссылок:


3
Я отредактировал свой вопрос, добавив несколько примеров поиска в Интернете, которые четко показывают, что остатки НЕ ВСЕГДА являются реальными минусами; альтернатива также довольно часто - отсюда мое замешательство. У меня вопрос, есть ли авторитетная документация правильного соглашения, которая, к сожалению, ваш ответ не дает.
Tripartio

5
В моем чтении наблюдается предсказано большинство современных конвенций в статистике. Примечательно, однако, что Гаусс использовал противоположное соглашение: естественные квадратные остатки одинаковы в любом случае в контексте наименьших квадратов, сумм квадратов или средних квадратов. Несмотря на то, что существуют прецеденты 19-го века и более ранние для рассмотрения отдельных остатков, забота о них и особенно составление графиков остатков не стали широко распространенными и рутинными до начала 1960-х годов. То есть, только когда знак остатков виден, каждому нужно заботиться о том, что это такое.
Ник Кокс

18
+1. Понятие остаточного происходит от «остатка; того, что осталось позади» : другими словами, что остается в данных после учета прогноза. Это говорит о том, что тот, кто назвал эти величины «остаточными», имел в виду определение «значение данных за вычетом установленного значения».
whuber

3
@NickCox, не могли бы вы оформить свои комментарии в виде ответа, с цитатами? Мой вопрос на самом деле не столько о статистике, сколько о научном соглашении, поэтому вид исторических данных и сведений об использовании, указанных в вашем комментарии, - это те ответы, которые я ищу.
Трипартио

6
Слово остаточный долго, долго предшествует Сальсбургу. Я должен сказать, что его книга, хотя иногда и интересная, далеко не авторитетна. Если вы заинтересованы, вы можете найти мой обзор в Biometrics jstor.org/stable/3068274
Ник Кокс,

22

Я просто наткнулся вескими причинами для одного ответа быть правильной.

yx

! [Рисунок 1: диаграмма рассеяния с линией наименьших квадратов.

Синяя кривая соответствует обычному наименьшему квадрату. Он отображает установленные значения.

yy^

Рисунок 2: Остатки против прогнозируемых значений.

Это стандартный диагностический график, показывающий, как смещенные условные распределения зависят от прогнозируемых значений. Геометрически, это почти то же самое, что и "пока" на предыдущем графике рассеяния.

y^y,

Рисунок 3: предыдущий график с отрицательными остатками

Это показывает те же величины, что и на предыдущем рисунке, но остатки были вычислены путем вычитания данных из их подгонки - что, конечно, то же самое, что отрицание предыдущих остатков.

Хотя обе предыдущие фигуры математически эквивалентны во всех отношениях - одна конвертируется в другую, просто переворачивая точки на голубом горизонте, - одна из них имеет гораздо более прямое визуальное отношение к исходному графику.

Следовательно, если наша цель состоит в том, чтобы связать характеристики распределения остатков с характеристиками исходных данных - и это почти всегда так - тогда лучше просто сместить ответы, чем смещать и обращать их вспять.

yy^.


1
Я не думаю, что следую тому, что здесь особенного в асимметрии - разве ваш аргумент об остатках, совпадающих с исходным сюжетом, не стоит сам по себе?
MichaelChirico

2
@ Майкл Вы совершенно правы. Однако асимметрия полезна для иллюстрации этой точки, поскольку она четко отличает форму распределения от формы его негатива.
whuber

10

Green & Tashman (2008, Foresight ) сообщает о небольшом опросе по аналогичному вопросу об ошибках прогноза. Я суммирую аргументы для любого соглашения, как они сообщают:

Аргументы в пользу "фактического предсказания"

  1. y=y^+ϵ
  2. По крайней мере, один респондент из сейсмологии написал, что это также соглашение для моделирования времени прохождения сейсмической волны. «Когда фактическая сейсмическая волна прибывает до времени, предсказанного моделью, мы имеем отрицательный остаток времени перемещения (ошибка)». ( так )

  3. y^

  4. +

Аргументы за "предсказуемый-актуальный"

  1. y=y^ϵ

    Соответственно, если положительное отклонение определено как положительные ожидаемые ошибки, это будет означать, что прогнозы в среднем слишком высоки с этим соглашением.

    И это в значительной степени единственный аргумент в пользу этого соглашения. Опять же, учитывая недопонимание, к которому может привести другое соглашение (положительные ошибки = прогноз слишком низкий), оно является сильным.

В конце концов, я бы сказал, что все зависит от того, кому вы должны сообщить свои остатки. И, учитывая, что в этом обсуждении, безусловно, есть две стороны, имеет смысл четко указать, какое соглашение вы соблюдаете.


7
x

3
@NickCox: абстрактно, вы правы. Однако возьмите большое количество людей и спросите их: «Прогноз погоды для сегодняшней температуры имел большую положительную ошибку. Считаете ли вы, что прогноз был (A) слишком высоким или (B) слишком низким ?» Я думаю, что могу предсказать, какой из (A) или (B) выберет подавляющее большинство.
С. Коласса - Восстановить Монику

6
Да, и если бы вы сформулировали этот вопрос как «Считаете ли вы, что температура была (A) выше или (B) ниже прогноза», вы вполне могли бы получить совершенно противоположные ответы! Ссылка на «положительную ошибку» поднимает только вопрос «что это за ошибка», и это приводит нас - совершенно круговым образом - прямо к первоначальному вопросу.
whuber

2
@whuber, это довольно неестественная формулировка вопроса. Учитывая, что «наблюдаемое» является «фиксированным», отношение модели к нему кажется более естественным, чем наоборот. Я получаю штраф за превышение скорости, а не «ограничение скорости было ниже моей скорости». Аргументы на естественном языке определенно имеют ограниченное применение к техническим терминам / языку, хотя /
mbrig

2
@whuber Что я говорю, так это то, что один из способов сформулировать вопрос явно более естественен (по крайней мере, на английском).
mbrig

4

Разная терминология предполагает разные условности. Термин «остаточный» подразумевает, что это то, что осталось после того, как все объясняющие переменные были приняты во внимание, то есть фактически предсказаны. «Ошибка прогноза» подразумевает, что именно то, насколько прогноз отклоняется от фактического, то есть прогноз-факт.

X=x1,x2...yy^

yy^Xyy^y^yy^y^yy^ye=y^y

y^XXxf(X)f(X)+error()y^Xy2xg

y^=2xg
y=y^+error

y^yy^X

2xgy=y^+error

X

y^=f(X)
y=y^+g(?)
g=yy^


4

Ответ @Aksakal полностью правильный, но я просто добавлю еще один элемент, который, как мне кажется, поможет мне (и моим ученикам).

Девиз: статистика "идеальна". Например, я всегда могу дать идеальный прогноз (я знаю, что некоторые брови поднимаются прямо сейчас ... так что выслушайте меня).

yiy^i

yiy^i
ϵi
yi=y^i+ϵi
Теперь у нас есть «идеальный» прогноз ... наше «окончательное» значение соответствует нашему наблюдаемому значению.

ϵi


2
y^iyi

6
Почему «лучше всего добавить это к нашему прогнозируемому значению»? Почему бы не «посмотреть, сколько данных необходимо отрегулировать, чтобы соответствовать нашему прогнозу»? Ни один из подходов, кажется, не претендует на то, чтобы быть более очевидным, значимым или «интуитивным», чем другой.
whuber

2
@whuber один элемент «реальный» (наблюдаемый, конкретный), другой - (гипотетический) конструкт; если бы мы моделировали рост, основываясь на весе, reasonable было бы разумно «сжимать» кого-то на 3 дюйма только для того, чтобы его фактическая / наблюдаемая высота соответствовала некоторому (воображаемому) прогнозируемому значению?
Грегг Х

2
Да, это обычный способ думать о данных. Я лишь пытаюсь указать, что ваши предположения о том, как люди будут воспринимать этот вопрос и понимать значение слова «лучший», могут быть умозрительными и субъективными.
whuber

Справедливая точка зрения ... обновлю кратким комментарием
Грегг Х

2

Я собираюсь использовать частный случай линейной регрессии наименьших квадратов. Если мы возьмем нашу модель , чтобы быть , то в качестве точек @Aksakal , что мы , естественно , в конечном итоге с так . Если вместо того, чтобы взять в нашей модели, которую мы , конечно , вольны делать, то мы получим . На данный момент нет никакой причины предпочитать одно другому, кроме смутного предпочтения над .Y=Xβ+εε=YXβε^=YY^Y=Xβεε=XβYε^=Y^Y11

Но если , то мы получим наши остатки с помощью , где является матрицей идемпотентной проектировании в пространство , ортогонального пространство столбцов матрицы . Если вместо этого мы использовали , то мы в конечном итоге с . Но само по себе не является идемпотентом, поскольку . Так что на самом деле является негативом матрицы проекции, а именно . Так что я рассматриваю это как отмену негатива, введенного с помощью , поэтому ради экономии лучше просто использоватьε^=YY^(IPX)YIPXXY=Xβεε^=(PXI)YPXIР Х - Я Я - Р Х У = Х β - ε Y = X β + ε Y - Y(PXI)2=PX22PX+I=(PXI)PXIIPXY=XβεY=Xβ+ε что в свою очередь дает нам в качестве остатков.YY^

Как уже упоминалось в других местах это не как - нибудь ломается , если мы используем , но мы в конечном итоге с этой двойной негативной ситуации, я думаю , что это достаточно хорошая причина , чтобы просто использовать .Y - YY^YYY^


Но написание чего-либо имеет ничего общего со знаками конкретных значений , как и написание является обязательством или предположением, что или положительны на практике. Это может быть то же самое уравнение , но с обратной по знаку. e y = β 0 + β 1 x β 0 β 1 e+eey=β0+β1xβ0β1e
Ник Кокс

@NickCox спасибо за ваш комментарий, я понимаю, что мой ответ основывался на предположении, что мы хотим написать нашу модель . Я переписал это для решения этой проблемыY=Xβ+ε
JDD
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.