Могут ли RMSE и MAE иметь одинаковое значение?


9

Я внедряю перекрестную проверку и вычисляю метрики ошибок, такие как RMSE, , MAE, MSE и т. Д.R2

Могут ли RMSE и MAE иметь одинаковое значение?


1
Да. Почему бы нет? Пусть всегда равен а предиктор для всегда равен . Там у вас это естьX0X1
Дэвид

Ответы:


17

Да, в теории. Самый простой случай, который я могу себе представить, - это набор данных, в котором все ошибки прогнозирования (то есть невязки) равны 1. RMSE и MAE будут возвращать идентичные значения 1. Можно также построить другие сценарии, но ни один из них не представляется вероятным.±

РЕДАКТИРОВАТЬ: Спасибо @DilipSarwate за указание (подробно изложено @ user20160 в их превосходном ответе), что этот результат возможен тогда и только тогда, когда абсолютные значения всех ошибок прогнозирования идентичны. Другими словами, в моем примере нет ничего особенного в значении 1; любой другой номер будет работать вместо 1.±


1
Не могли бы вы привести пример других сценариев, которые вы себе представляете? Я имею в виду пример, отличный от скалярного кратного (когда все остатки составляют вместо ± 1 ) из приведенного выше примера. ±σ±1
Дилип

@DilipSarwate Я размышлял об этом, когда user20160 добавил гораздо лучший ответ, который охватывает его более подробно, чем я мог.
mkt - Восстановить Монику

1
@mkt Спасибо за добрые слова. Ваш ответ правильный и краткий (+1)
user20160

@DilipSarwate Спасибо за вклад
mkt - Восстановить Монику

1
Пара дополнительных украшений к вашему ответу: (i) должно быть четным (скажем, n = 2 k ) и (ii) ровно k остатков должно иметь значение + σ, и ровно k остатков должно иметь значение - σ , что, конечно, означает, что все остатки имеют абсолютное значение σ, как вы заявляете, но (ii) гарантирует, что остатки в сумме равны 0, как они должны. Остатки являются отклонениями от среднего значения и поэтому должны суммироваться до нуля. Nn=2kk+σkσσ0
Дилип

23

Средняя абсолютная ошибка (MAE) может равняться среднеквадратичной ошибке (MSE) или среднеквадратичной ошибке (RMSE) при определенных условиях, которые я покажу ниже. Эти условия вряд ли возникнут на практике.

прелиминарии

Пусть рязнак равно|Yя-Y^я|обозначим абсолютное значение невязки для я й точки данных, и пусть рзнак равно[ря,...,рN]T - вектор, содержащий абсолютные невязки для всех N точек в наборе данных. Обозначение 1 обозначает вектор единиц N×1 , MAE, MSE и RMSE можно записать в виде:

(1)MAЕзнак равно1N1TрMSЕзнак равно1NрTррMSЕзнак равно1NрTр

MSE

Установка MSE равной MAE и перестановка дает:

(2)(р-1)Tрзнак равно0

MSE и MAE равны для всех наборов данных, где абсолютные невязки решают вышеприведенное уравнение. Два очевидных решения: рзнак равно0 (нулевая ошибка) и рзнак равно1 (все остатки равны ±1 , как упоминалось в mkt). Но существует бесконечно много решений.

Мы можем интерпретировать уравнение (2) геометрически следующим образом: LHS является точечным произведением р-1 и р . Произведение с нулевой точкой подразумевает ортогональность. Таким образом, MSE и MAE равны, если вычитание 1 из каждого абсолютного остатка дает вектор, который ортогонален исходным абсолютным остаткам.

Кроме того, заполнив квадрат, уравнение (2) можно переписать так:

(3)(р-121)T(р-121)знак равноN4

Это уравнение описывает N мерную сферу с центром в [12,...,12]Tс радиусом12N . MSE и MAE равны тогда и только тогда, когда абсолютные остатки лежат на поверхности этой гиперсферы.

RMSE

Установка RMSE равной MAE и перестановка дает:

(4)рTAрзнак равно0

Aзнак равно(Nя-11T)

где я - единичная матрица. Множество решений является нулевым пространством из A ; то есть множество всех р таких, что Aрзнак равно0 . Чтобы найти нулевое пространство, обратите внимание, что A - это матрица N×N с диагональными элементами, равными N-1 и всеми другими элементами, равными -1 . Утверждение Aрзнак равно0 соответствует системе уравнений:

(5)(N-1)ря-ΣJярJзнак равно0я

Или, переставляя вещи:

(6)рязнак равно1N-1ΣJярJя

То есть каждый элемент ря должен равняться среднему значению других элементов. Единственный способ удовлетворить это требование - чтобы все элементы были равны (этот результат также может быть получен при рассмотрении собственного разложения A ). Следовательно, набор решений состоит из всех неотрицательных векторов с одинаковыми элементами:

{р|рзнак равнос1с0}

Таким образом, RMSE и MAE равны тогда и только тогда, когда абсолютные значения остатков равны для всех точек данных.


1
r

1
На самом деле, вопрос заключался в том, могут ли RMSE и MAE быть когда-либо равными, а не в том, могут ли MSE и MAE быть равными. Возможно, ответ @ mkt (или его обобщенная версия, которую я предложил в комментарии) является единственным ответом на вопрос RMSE = MAE?
Дилип

@DilipSarwate, да, после публикации понял, что пропустил часть 'R'. Я отредактировал, чтобы включить RMSE сейчас. Я полагаю, что предложенная вами версия является единственным возможным ответом в этом случае.
user20160

@whuber Это хороший момент. Я постараюсь редактировать что-то вроде этого.
user20160

2
@Hiyam Если есть только 1 значение, то RMSE по определению должен быть равен MAE. Поскольку есть только 1 ошибка, возведение ее в квадрат и получение корня просто возвращает абсолютное значение исходной ошибки.
mkt - Восстановить Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.