Ответ зависит от вида отношений, которые вы хотите представить между временной характеристикой и целевой переменной.
Если вы кодируете время как числовое, то вы накладываете определенные ограничения на модель. Для модели линейной регрессии влияние времени теперь монотонно, либо цель будет увеличиваться или уменьшаться со временем. Для деревьев решений значения времени, близкие друг к другу, будут сгруппированы.
Кодирование времени как категориального дает модели большую гибкость, но в некоторых случаях модель может не иметь достаточно данных для хорошего изучения. Один метод, который может быть полезен, состоит в том, чтобы сгруппировать значения времени вместе в некоторое количество наборов и использовать набор в качестве категориального атрибута.
Некоторые примеры групп:
- В течение месяца группируйте по кварталам или сезонам, в зависимости от варианта использования. Например: январь-март, апрель-июнь и т. Д.
- Для часа дня, сгруппируйте в ведра времени дня: утро, вечер и т. Д.,
- Для дня недели, группа в будний день, выходные.
Каждое из вышеперечисленного также может использоваться непосредственно в качестве категориального атрибута, учитывая достаточно данных. Кроме того, группировки могут быть обнаружены путем анализа данных, чтобы дополнить подход, основанный на знании предметной области.