Как среднеквадратичная ошибка (RMSE), так и коэффициент детерминации ( )р2 предоставляют различную, но дополняющую информацию, которая должна оцениваться при оценке вашей физической модели. Ни один из них не «лучше», но некоторые отчеты могут фокусироваться больше на одной метрике в зависимости от конкретного приложения.
Я хотел бы использовать следующее в качестве очень общего руководства для понимания различий между обеими метриками:
RMSE дает вам ощущение того , насколько близко (или далеко) ваши предсказанные значения из фактических данных , которые вы пытаетесь модели. Это полезно в различных приложениях, где вы хотите понять точность и точность предсказаний вашей модели (например, высота дерева моделирования).
Pros
- Это относительно легко понять и сообщить, так как сообщаемые значения находятся в тех же единицах, что и моделируемая зависимая переменная.
Cons
- Он чувствителен к большим ошибкам (штрафует большие ошибки предсказания больше, чем меньшие ошибки предсказания).
Коэффициент детерминации ( )р2 полезно , когда вы пытаетесь понять , насколько хорошо выбранная независимая переменная (s) объясняют изменчивость в вашей зависимой переменной (ы). Это полезно, когда вы пытаетесь объяснить, какие факторы могут влиять на основной интересующий процесс (например, климатические переменные и условия почвы, связанные с высотой дерева).
Pros
- Дает общее представление о том, насколько хорошо выбранные переменные соответствуют данным.
Cons
- По мере того, как в вашу модель добавляется больше независимых переменных, увеличивается (см. Прил. или информационный критерий Акаике в качестве потенциальных альтернатив).р2р2
Конечно, вышеизложенное будет зависеть от размера выборки и структуры выборки, и общее понимание того, что корреляция не подразумевает причинно-следственную
This value shows how well future outcomes can be predicted by the model
- это чрезвычайно вводит в заблуждение и склоняется к просто неправильному . Нет гарантии, что высокий коэффициент детерминации в данной модели зависит от того, насколько хорошо будут предсказаны будущие результаты.