Никакого «общего подхода» для этого не существует, по крайней мере, насколько мне известно. Кроме того, вы все равно пытаетесь минимизировать метрику расстояния. Например, в дедушке статей DTW Sakoe & Chiba (1978) используетсяв качестве измерения разницы между двумя характеристическими векторами.| | я- бя| |
Как вы правильно определили, вам нужно иметь одинаковое количество баллов (обычно), чтобы это работало из коробки. Я бы предложил использовать сглаживание / интерполятор lowess () поверх ваших кривых, чтобы сначала сделать их равными по размеру. Это довольно стандартный материал для "кривой статистики". Вы можете увидеть пример приложения в Chiou et al. (2003) ; Авторы не заботятся о DTW как таковом в этой работе, но это хороший пример того, как справляться с чтениями неравного размера.
Кроме того, как вы говорите, «амплитуда» является проблемой. Это немного более открытый конец, если честно. Вы можете попробовать подход Area-Under-the-Curve, подобный тому, который предложен Zhang and Mueller (2011), чтобы позаботиться об этом, но на самом деле в целях временной деформации даже нормализации сверх нормы (т.е. заменить на можно сделать так, как в этой статье Tang and Mueller (2009) . Я бы следовал второму, но в любом случае, как вы заметили, нормализация выборок является необходимость.f ( x )е( х )е( х )S U PY| е( х ) |
В зависимости от характера ваших данных вы можете найти больше литературы по конкретным приложениям. Я лично считаю подход минимизации по отношению к целевой попарной функции деформации наиболее интуитивным из всех. Таким образом, целевая функция для минимизации:
, где все это , несмотря на это uncanniness на самом деле довольно прост: вы пытаетесь найти , чтобы найти коробление функцию , что сводит к минимуму ожидаемой суммы несоответствия искривленного кривого запроса к опорная кривая (термингСλ( Yя, YК, г) = E{ ∫T( Yя( г( т ) ) - YК( т ) )2+ λ ( г( т ) - т )2dт | Yя, YК}гY k ( t ) Y i ( g ( t ) ) - Y k ( t ) g ( t ) - tYя( г( т ) )YК( т )Yя( г( т ) ) - YК( т )) при условии некоторой нормализации временного искажения, которое вы налагаете на эту деформацию (термин ). Это то, что реализует пакет PACE в MATLAB . Я знаю, что существует R-пакет fda от JO Ramsay et al. это могло бы также помочь, но я лично не использовал его (немного досадно, что стандартная ссылка для методов этого пакета во многих случаях - отличная книга Рэмси и Сильвермана, Функциональный анализ данных (2006), 2-е изд. , 400-страничная книга, чтобы получить то, что вы ищете, по крайней мере, это хорошо читать в любом случае)г( т ) - т
Проблема, которую вы описываете в статистической литературе, широко известна как « регистрация кривых » (например, см. Gasser and Kneip (1995) для ранней обработки проблемы) и подпадает под общий принцип методов анализа функциональных данных .
(В тех случаях, когда я мог найти оригинальную статью, доступную онлайн, ссылка направляет туда; в противном случае ссылка направляет в общую цифровую библиотеку. Почти все упомянутые статьи можно найти в черновиках версий бесплатно. Я удалил свой оригинальный комментарий, как есть заменено этим постом.)