Многомерные биологические временные ряды: VAR и сезонность


15

У меня есть многомерный набор данных временных рядов, включающий взаимодействующие биологические и экологические переменные (плюс, возможно, некоторые экзогенные переменные). Помимо сезонности, в данных нет четкой долгосрочной тенденции. Моя цель - увидеть, какие переменные связаны друг с другом. Прогнозирование на самом деле не искали.

Будучи новичком в анализе временных рядов, я прочитал несколько ссылок. Насколько я понимаю, модель с векторной авторегрессией (VAR) была бы уместна, но я не чувствую себя комфортно с сезонностью, и большинство найденных примеров касалось области экономики (как часто с анализом временных рядов ...) без сезонности.

Что мне делать с моими сезонными данными? Я рассмотрел их десезонализацию - например, в R я бы использовал, decomposeа затем использовал $trend + $randзначения, чтобы получить сигнал, который выглядит довольно стационарно (согласно оценке acf). Результаты модели VAR меня смущают (модель с 1 лагом выбрана, хотя я бы интуитивно ожидал большего, и значимыми являются только коэффициенты для авторегрессии, а не для регрессии с другими лаговыми переменными). Я делаю что-то не так, или я должен сделать вывод, что мои переменные не (линейно) связаны / моя модель не является хорошей (дополнительный вопрос: существует ли нелинейный эквивалент VAR?).

[В качестве альтернативы я читал, что мог бы использовать фиктивные сезонные переменные, хотя я не могу точно определить, как это реализовать].

Пошаговые предложения будут очень признательны, поскольку подробности для опытных пользователей могут быть действительно информативными для меня (и фрагменты кода R или ссылки на конкретные примеры, конечно, очень приветствуются).


2
Многое зависит от того, как вы думаете о сезонности. Мое неоднозначное прочтение литературы показывает, что экономисты часто считают сезонность неинтересной неприятностью, в то время как ученые-экологи чувствуют себя гораздо более позитивно. Метод фиктивных переменных, используемый в экономике, часто зависит от того, являются ли данные ежеквартальными или ежемесячными, а влияние праздников (во всех смыслах этого слова) иногда является резким; С данными об окружающей среде вы можете иногда справляться с некоторыми фурье (синусоидальными) терминами и не должны прибегать к манекенам.
Ник Кокс

2
Спасибо, Ник Кокс. Термины Фурье, по-видимому, не являются решением в моем конкретном случае, когда переменные показывают более сложную сезонную картину, чем синусоидальные сигналы (если я не использую несколько гармоник, но здесь это не столько цель). И хотя сезонность явно не является неинтересным термином раздражения в моем случае, я больше искал что-то, что помогло бы мне объяснить дополнительную изменчивость данных за пределами сезонности (т. Е. Долгосрочный тренд) в зависимости от других переменных.
ZTL

4
А как насчет многомерной модели ARMA? Это похоже на VAR, но, если я правильно понимаю, позволяет более динамичное взаимодействие между переменными. Кто-то еще может подтвердить / отклонить мое подозрение.
rbatt

Ответы:


1

Я знаю, что этот вопрос довольно старый, но он остался без ответа. Возможно, главный вопрос не в том, как удалить сезонный цикл в данных, а в его части, поэтому я попытаюсь: для удаления сезонности из набора данных есть несколько методов, от простых среднемесячных агрегированных значений до подгонка синусоидальной (или другой подходящей гармонической) функции с помощью нелинейных методов подбора, таких как Nelder-Mead.

Самый простой способ - это усреднить данные, принадлежащие всем январям, всем февралям и т. Д., То есть вы создаете составной годовой цикл, который затем вы можете вычесть из своих данных

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.