Я использовал пакет caret в R для построения прогностических моделей для классификации и регрессии. Caret предоставляет унифицированный интерфейс для настройки гиперпараметров модели путем перекрестной проверки или привязки загрузки. Например, если вы строите простую модель «ближайших соседей» для классификации, сколько соседей вы должны использовать? 2? 10? 100? Caret помогает вам ответить на этот вопрос путем повторной выборки ваших данных, опробования различных параметров, а затем агрегирования результатов, чтобы решить, какие из них дают наилучшую точность прогнозирования.
Мне нравится этот подход, потому что он предоставляет надежную методологию для выбора гиперпараметров модели, а после выбора окончательных гиперпараметров он дает перекрестную проверку оценки «хорошей» модели с использованием точности для моделей классификации. и RMSE для регрессионных моделей.
Теперь у меня есть данные временных рядов, для которых я хочу построить регрессионную модель, возможно, с использованием случайного леса. Что является хорошим методом для оценки точности прогнозирования моей модели с учетом характера данных? Если случайные леса на самом деле не применяются к данным временных рядов, каков наилучший способ построения точной ансамблевой модели для анализа временных рядов?