Полезно сделать шаг назад и на минуту забыть об аспекте прогнозирования. Давайте рассмотрим просто любое распределение и предположим, что мы хотим суммировать его, используя одно число.F
Вы изучаете очень рано в ваших классах статистики, которые используют ожиданиеF в качестве единого числа сводит к минимуму ожидаемую квадратичную ошибку.
Вопрос теперь: почему с помощью медианы из минимизировать ожидаемую абсолютную ошибку?F
Для этого я часто рекомендую «Визуализация медианы как местоположения с минимальным отклонением» от Hanley et al. (2001, Американский статистик ) . Они создали небольшой апплет вместе со своей бумагой, которая, к сожалению, вероятно, больше не работает с современными браузерами, но мы можем следовать логике в статье.
Предположим, вы стоите перед банком лифтов. Они могут быть расположены на одинаковом расстоянии, или некоторые расстояния между дверями лифта могут быть больше, чем другие (например, некоторые лифты могут не работать). Перед каким лифтом вы должны стоять, чтобы иметь минимальную ожидаемую прогулку, когда один из лифтов делает прибыть? Обратите внимание, что эта ожидаемая прогулка играет роль ожидаемой абсолютной ошибки!
Предположим, у вас есть три лифта A, B и C.
- Если вы ждете перед A, вам может потребоваться пройти от A до B (если B прибывает), или от A до C (если C прибывает) - прохождение B!
- Если вы ждете перед B, вам нужно пройти от B к A (если A прибывает) или от B к C (если C прибывает).
- Если вы ждете перед C, вам нужно пройти от C до A (если A прибывает) - проходя B - или от C до B (если B прибывает).
Обратите внимание, что от первой и последней позиции ожидания есть расстояние - AB в первой, BC в последней позиции - вам нужно пройти несколько раз. случаях прибытия лифтов. Поэтому вам лучше всего стоять прямо перед средним лифтом - независимо от того, как расположены три лифта.
Вот рисунок 1 от Hanley et al .:
Это легко обобщает более трех лифтов. Или к лифтам с разными шансами прибыть первыми. Или действительно к бесконечно большому количеству лифтов. Таким образом, мы можем применить эту логику ко всем дискретным распределениям, а затем перейти к пределу для получения непрерывных распределений.
F^
F^λ ≤ ln2
Таким образом, если вы подозреваете, что ваше прогнозное распределение является (или должно быть) асимметричным, как в двух вышеупомянутых случаях, тогда, если вы хотите получить непредвзятые прогнозы ожидания, используйте команду rmse . Если распределение можно считать симметричным (как правило, для серий с большими объемами), то медиана и среднее значение совпадают, и использование mae также приведет вас к непредвзятым прогнозам - и MAE легче понять.
Точно так же минимизация mape может привести к смещенным прогнозам, даже для симметричных распределений. Этот мой предыдущий ответ содержит смоделированный пример с асимметрично распределенными строго положительными (логнормально распределенными) рядами, которые могут быть целенаправленно спрогнозированы с использованием трех разных точечных прогнозов, в зависимости от того, хотим ли мы минимизировать MSE, MAE или MAPE.