Чтобы решить, какую точечную погрешность использовать, нам нужно сделать шаг назад. Обратите внимание, что мы не знаем точно будущих результатов, и никогда не узнаем. Таким образом, будущий результат следует за распределением вероятностей . Некоторые методы прогнозирования явно выдают такое полное распределение, а некоторые нет - но оно всегда есть, хотя бы неявно.
Теперь мы хотим получить хорошую погрешность для точечного прогноза . Такой точечный прогноз Ft является нашей попыткой обобщить то, что мы знаем о будущем распределении (т. Е. Прогнозном распределении) во времениt используя одно число, так называемыйфункционалбудущей плотности. Мера ошибки, таким образом, является способом оценки качества этого краткого резюме.
Таким образом, вы должны выбрать меру ошибки, которая вознаграждает «хорошие» итоговые значения (неизвестные, возможно прогнозируемые, но, возможно, только неявные) будущих плотностей.
Проблема заключается в том, что разные показатели ошибок минимизируются разными функционалами. Ожидаемая MSE сводится к минимуму ожидаемым значением будущего распределения. Ожидаемое MAD минимизируется медианой будущего распределения. Таким образом, если вы откалибруете свои прогнозы, чтобы минимизировать MAE, ваш точечный прогноз будет будущей медианой, а не будущим ожидаемым значением, и ваши прогнозы будут смещены, если ваше будущее распределение не будет симметричным.
Это наиболее актуально для данных подсчета, которые обычно искажены. В крайних случаях (скажем, распределение Пуассона распределяется со средним значением журнал2 ≈ 0,69 ), ваш MAE будет наименьшим для прогноза с плоским нулем. Смотрите здесь или здесь или здесь для деталей.
Я даю дополнительную информацию и иллюстрацию в разделе «Каковы недостатки ошибки среднего абсолютного процента (MAPE)»?Этот поток рассматривает mape , но также и другие меры ошибки, и он содержит ссылки на другие связанные потоки.
В конце концов, какой показатель ошибки использовать, зависит от вашей стоимости ошибки прогноза, т. Е. Какой тип ошибки является наиболее болезненным. Не смотря на реальные последствия ошибок прогноза, любое обсуждение «лучших критериев» в принципе бессмысленно.
Меры точности прогноза были большой темой в сообществе прогнозистов несколько лет назад, и они все еще появляются время от времени. Одна очень хорошая статья - Hyndman & Koehler «Другой взгляд на показатели точности прогноза» (2006).
Наконец, одна альтернатива состоит в том, чтобы рассчитать полные прогностические плотности и оценить их, используя надлежащие правила подсчета .