Предположим, у кого-то есть временной ряд, из которого можно выполнить различные измерения, такие как период, максимум, минимум, среднее и т. Д., А затем использовать их для создания модельной синусоидальной волны с такими же атрибутами. Существуют ли какие-либо статистические подходы, которые можно использовать для количественной оценки? насколько точно фактические данные соответствуют предполагаемой модели? Количество точек данных в серии будет варьироваться от 10 до 50 точек.
Первой моей очень упрощенной мыслью было приписать значение направленному движению синусоиды, то есть +1 +1 +1 +1 -1 -1 -1 -1 -1 -1 -1 -1 +1 +1 +1 +1, сделайте то же самое с фактическими данными, а затем каким-то образом определите степень сходства направленного движения.
Изменить: уделив больше внимания тому, что я действительно хочу сделать с моими данными, и в свете ответов на мой первоначальный вопрос, мне нужен алгоритм принятия решения для выбора между конкурирующими предположениями: а именно, что мои данные в основном линейны (или в тренде) с шумом, который может иметь циклические элементы; мои данные в основном циклические, без указания направления; данные по сути просто шум; или это переход между любыми из этих состояний.
Теперь я думаю о том, чтобы объединить некоторую форму байесовского анализа и евклидовой / LMS метрики. Шаги в этом подходе будут
Создание предполагаемой синусоиды из данных измерений
Подгонка прямой линии LMS к данным
Получите евклидову или LMS метрику для отклонений от исходных данных для каждого из вышеперечисленных
Создайте байесовский априор для каждого на основе этого показателя, т. Е. 60% комбинированных отклонений привязаны к одному, 40% к другому, следовательно, предпочтение составляет 40%
сдвиньте окно на одну точку данных вдоль данных и повторите вышеописанное, чтобы получить новые метрики% для этого слегка измененного набора данных - это новое доказательство - проведите байесовский анализ, чтобы создать апостериорный и изменить вероятности, которые благоприятствуют каждому предположению
повторить весь набор данных (3000+ точек данных) с этим скользящим окном (длина окна 10-50 точек данных). Надежда / намерение состоит в том, чтобы определить преобладающее / предпочтительное допущение в любой точке набора данных и как оно меняется со временем
Любые комментарии по этой потенциальной методологии будут приветствоваться, особенно о том, как я мог бы на самом деле реализовать часть анализа Байеса.