Я часто слышу об оценке эффективности модели классификации, проводя тестовый набор и обучая модель на тренировочном наборе. Затем создаем 2 вектора, один для прогнозируемых значений и один для истинных значений. Очевидно, что сравнение позволяет судить о производительности модели по ее прогнозирующей способности, используя такие вещи, как F-Score, Kappa Statistic, Precision & Recall, ROC-кривые и т. Д.
Как это соотносится с оценкой численного предсказания, такого как регрессия? Я предполагаю, что вы можете обучить регрессионную модель на обучающем наборе, использовать ее для прогнозирования значений, а затем сравнить эти предсказанные значения с истинными значениями, содержащимися в тестовом наборе. Очевидно, что показатели эффективности должны были бы быть другими, поскольку это не является задачей классификации. Обычные невязки и статистика являются очевидными показателями, но существуют ли более / более эффективные способы оценки производительности для регрессионных моделей? Кажется, что у классификации есть так много вариантов, но регрессия остается до и остатков.R 2