Как мне придать больший вес более поздним наблюдениям в R?
Я предполагаю, что это часто задаваемый вопрос или желание, но мне трудно понять, как именно это реализовать. Я пытался много искать для этого, но я не могу найти хороший практический пример.
В моем примере у меня будет большой набор данных со временем. Я хочу сказать, применить некоторый экспоненциальный вес строк данных, которые являются более свежими. Таким образом, у меня была бы какая-то экспоненциальная функция, говорящая, что наблюдения в 2015 году ___ более важны для обучения модели, чем наблюдения в 2012 году.
Мои переменные набора данных содержат сочетание категориальных и числовых значений, а моя цель - числовое значение, если это имеет значение.
Я хотел бы проверить / опробовать это, используя такие модели, как GBM / Random Forest, в идеале в пакете CARET.
обновление-вопрос
Я благодарен за приведенный ниже ответ о том, как экспоненциально уменьшить вес на расстояние между двумя точками.
Однако, когда дело доходит до обучения этой модели в карете, как именно учитывается вес? Значение веса в каждом из тренировочных рядов - это расстояние между некоторой точкой в будущем и историческим моментом, когда эта точка возникла.
Веса вступают в игру только во время предсказания? Потому что, если они вступят в игру во время тренировки, не вызовет ли это всевозможных проблем, поскольку различные перекрестные сгибы будут иметь различный вес, пытаясь предсказать что-то, что может действительно иметь место в определенный момент времени до этого?