У меня есть набор данных временных рядов. Каждая серия охватывает один и тот же период, хотя фактические даты в каждом временном ряду могут не совпадать точно.
То есть, если бы временной ряд читался в двухмерной матрице, он бы выглядел примерно так:
date T1 T2 T3 .... TN
1/1/01 100 59 42 N/A
2/1/01 120 29 N/A 42.5
3/1/01 110 N/A 12 36.82
4/1/01 N/A 59 40 61.82
5/1/01 05 99 42 23.68
...
31/12/01 100 59 42 N/A
etc
Я хочу написать сценарий R, который будет разделять временные ряды {T1, T2, ... TN} на «семейства», где семья определяется как набор рядов, которые «имеют тенденцию двигаться в согласии» друг с другом.
Для части «кластеризация» мне нужно будет выбрать / определить вид меры расстояния. Я не совсем уверен, как поступить с этим, поскольку я имею дело с временными рядами, а пара последовательных, которые могут двигаться с сочувствием в течение одного интервала, может не делать этого в последующий интервал.
Я уверен, что здесь гораздо больше опытных / умных людей, чем я, поэтому я был бы благодарен за любые предложения, идеи о том, какой алгоритм / эвристику использовать для измерения расстояния и как использовать его при кластеризации временных рядов.
Я предполагаю, что для этого НЕ существует надежного статистического метода, поэтому мне было бы очень интересно посмотреть, как люди подходят к этой проблеме и решают ее - думая как статистик.