Auto.arima vs autobox они отличаются?


16

Из чтения сообщений на этом сайте я знаю, что есть функция R auto.arimaforecast пакете ). Я также знаю, что IrishStat , участник этого сайта, создал коммерческий пакет autobox в начале 1980-х годов. Поскольку эти два пакета существуют сегодня и автоматически выбирают модели arima для заданных наборов данных, что они делают по-разному? Будут ли они производить разные модели для одного и того же набора данных?


Спасибо за редактирование @Wayne. Я не знаком с пакетом прогноза R, но я уверен, что именно это я и хочу сравнить с autobox.
Майкл Р. Черник

(Я только что сделал второе небольшое изменение «auto-arima» на «auto.arima».) В auto.arimaдругих пакетах могут быть и другие функции, но определенно есть одна forecast, чье описание: «Возвращает лучшую модель ARIMA согласно к значению AIC, AICc или BIC. Функция выполняет поиск по возможной модели в пределах предоставленных ограничений заказа. "
Уэйн

1
AUTOBOX рассматривает автоматическую идентификацию целостным способом, повторяя автоматическую идентификацию путем фактической оценки, а затем выполняя диагностические процедуры повышения и понижения, чтобы отобразить модель, имеющую только статистически значимые параметры, в то время как процесс обработки ошибок не содержит идентифицируемой структуры. Таким образом, он следует сценарию итерации. Ранние версии AUTOBOX приблизительно в 1975 году пытались использовать «подход с одной статистикой», но это было обнаружено с учетом того, что идентифицированные модели либо имели избыточную, либо глупую структуру (например, 5,1,2), либо свидетельствовали о недостаточной структуре.
IrishStat

1
@IrishStat Это звучит как хороший подход. Что делать, если вы найдете две конкурирующие модели, которые соответствуют вашим требованиям. Это кажется возможным. Вы рекомендуете «оптимальную» модель, основанную на определенных критериях? Я понимаю, что выбор модели только с «статистически значимыми параметрами» может иметь тенденцию к скупости, но невозможно иметь процесс AR с низким параметром и другую модель AEMA низкого порядка, где все параметры статистически значимы, а остатки выглядят как белые шум?
Майкл Р. Черник

1
@IriehStat. Я согласен. В конце концов, что вы делаете для пользователя. Предоставляете ли вы только одну модель или можете упорядочить список конкурирующих приемлемых моделей? Если не последнее, может быть, это было бы хорошим вариантом, чтобы добавить, где вы ограничить список небольшим числом.
Майкл Р. Черник

Ответы:


9

МАЙКЛ / уэйн

AUTOBOX определенно предоставит / определит другую модель, если будет выполнено одно или несколько из следующих условий

1) в данных есть импульсы

2) в данных имеется 1 или более сдвиг уровня / шага

3) если в данных есть сезонные импульсы

4) в данных есть 1 или более локальных трендов времени, которые не просто исправляются

5) если параметры модели меняются со временем

6) если дисперсия ошибок изменяется с течением времени и нет достаточного преобразования мощности.

Что касается конкретного примера, я бы предложил вам обоим выбрать / сделать временной ряд и опубликовать их оба в Интернете. Я буду использовать AUTOBOX для анализа данных в автоматическом режиме и выложу модели в список. Затем вы запускаете программу R, а затем каждый из вас проводит отдельный объективный анализ обоих результатов, указывая на сходства и различия. Отправьте мне эти две модели вместе со всеми доступными вспомогательными материалами, включая окончательные условия ошибки, для моих комментариев. Подведите итоги и представьте эти результаты в список, а затем попросите читателей списка ГОЛОСОВАТЬ, какая процедура им кажется наиболее подходящей.


Вы имеете в виду конкурс , как этот ?
whuber

@whuber Да. Возможно, даже используя какой-то «пример неизвестного / закодированного учебника», который можно использовать в качестве фона.
IrishStat

22

Они представляют два разных подхода к двум похожим, но разным проблемам. Я написал, auto.arimaи @IrishStat является автором Autobox.

auto.arima()подходит для сезонных моделей ARIMA, включая условия дрейфа. Autoboxподходит для моделей передаточных функций, чтобы справляться со сдвигами и выбросами уровня. Модель ARIMA является частным случаем модели передаточной функции.

Даже если вы отключите сдвиги уровней и обнаружение выбросов Autobox, вы получите другую модель ARIMA из- auto.arima()за различных вариантов определения параметров ARIMA.

В моем тестировании на данных M3 и M-конкуренция, auto.arima()дает более точные прогнозы, чем Autoboxдля этих данных. Тем не менее, Autoboxбудет лучше с данными, содержащими основные выбросы и сдвиги уровня.


3
Я считаю, что вы имели в виду версию AUTOBOX много-много лет назад. AUTOBOX значительно изменился за эти годы. Если я не ошибаюсь, вы сравниваете только точность от 1 источника, и я уверен, что вы согласитесь, что это образец 1. Точность должна оцениваться по ряду источников.
IrishStat

15
Я имею в виду опубликованные сравнения по тысячам серий. Как главный редактор Международного журнала прогнозирования, я думаю, что у меня есть представление о том, как оценивать прогнозы.
Роб Хиндман

2
На этот вопрос я не собирался приводить аргументы о том, кто имеет лучший алгоритм прогнозирования. Я думаю, что и autobox, и auto.arima, вероятно, очень хорошие пакеты. Сравнение лицом к лицу может быть несправедливым по многим причинам. 1) Пользователь не может быть достаточно опытным, чтобы знать, как их судить. 2) Точность прогноза на одном временном ряду - дерьмовый выстрел Можно иметь более низкую среднеквадратичную ошибку в прогнозировании, но всякий раз, когда речь идет о случайности, ее необходимо учитывать. Вам нужно взглянуть на несколько серий, и, как предлагает IrishStat, вам следует взглянуть на разные отправные точки.
Майкл Р. Черник

Также были бы полезны разные точки для начала прогнозирования. 3) В мире ARIMA существует несколько представлений для одной и той же модели временных рядов, конечные процессы AR имеют бесконечные представления скользящих средних и наоборот. Таким образом, AR низкого порядка может быть почти таким же, как скользящее среднее высокого порядка или ARMA. Бокс всегда предлагал следовать принципу скупости. Но если у вас много данных, вы можете получить хорошие оценки параметров, и модель высокого порядка может генерировать почти те же прогнозы, что и экономный. 4) Два пакета имеют разные цели.
Майкл Р. Черник

3
Метод развивался с течением времени. Дейв Рейли очень активен на этом сайте, как IrishStat, и он очень открыто объясняет, как он работает в общих чертах. Важным аспектом бизнеса является наличие коммерческих секретов и собственных алгоритмов. С его точки зрения R наносит ущерб его бизнесу так же, как и для SPlus. Но он не показывает горечи и очень готов продемонстрировать свое программное обеспечение, как вы можете видеть, что он сделал сегодня. Он также готов проводить тесты с конкурентами, и я считаю, что он участвовал в соревнованиях по прогнозированию временных рядов.
Майкл Р. Черник

11

РЕДАКТИРОВАТЬ: На ваш комментарий, я считаю, что если вы отключите многие из autoboxвариантов, вы, вероятно, получите аналогичный ответ auto.arima. Но если вы этого не сделаете, и при наличии выбросов определенно будет существовать разница: auto.arimaони не заботятся о выбросах, а autoboxбудут их обнаруживать и соответствующим образом обрабатывать, что даст лучшую модель. Могут быть и другие различия, и я уверен, что IrishStat может их описать.


Я считаю, что autoboxобнаруживает выбросы и другие вещи, помимо поиска лучших коэффициентов AR, I и MA. Если это правильно, потребуется больше анализа и пара других функций R, чтобы иметь аналогичные функциональные возможности. И IrishStats является ценным членом этого сообщества и довольно дружелюбным.

Конечно, R бесплатен и может делать не так много, как ARIMA.

Еще один бесплатный выбор для ARIMA в экономическом стиле - X13-ARIMA SEATSБюро переписей США с открытым исходным кодом. Существуют двоичные файлы для Windows и Linux, но они легко компилируются на моем Mac, учитывая, что я уже загрузил компилятор gntran gnu. Он является преемником X12-ARIMAи был выпущен в последние несколько дней, после нескольких лет разработки и тестирования. (Он обновляет X12, а также добавляет функции SEATS / TRAMO. X12 - официальный инструмент США, а SEATS / TRAMO - от Банка Испании и «европейский инструмент».)

Мне действительно очень нравится X12 (и теперь X13). Если вы выложите достаточное количество диагностических сообщений, прочитаете их и узнаете, что они значат, это действительно хорошее образование в ARIMA и временных рядах. Я разработал свой собственный рабочий процесс, но есть пакет R x12для большей части работы внутри R (вам все еще нужно создать файл входной модели (".spc") для X12).

Я говорю, что X12 хорош в "экономическом стиле" ARIMA, чтобы иметь в виду ежемесячные данные с данными за более чем 3 года. (Вам нужны данные за 5+ лет, чтобы использовать некоторые диагностические функции.) Он имеет функцию идентификации выбросов, может обрабатывать все виды характеристик выбросов и может обрабатывать праздники, плавающие праздники, эффекты торгового дня и множество экономических вещей. Это инструмент, который правительство США использует для создания сезонно скорректированных данных.


Мой вопрос был действительно задан набор данных, будет ли два алгоритма, возможно, производить различные выборы модели. В действительности меня интересует автоматическая связь, а не ряд других диагностических функций, которые у одного может быть, а у другого - нет. Известно, что семейство моделей ARMA и две модели в семействе могут быть точными или почти точными альтернативными представлениями одной и той же модели. Поэтому, если есть незначительные различия в процедурах отбора, я бы подумал, что они могут дать другой выбор модели.
Майкл Р. Черник

3
@MichaelChernick: Ах. Я полагаю, что если вы отключите все автозапчасти, autoboxвы получите тот же ответ. Но одна из точек использования autoboxсостоит в том, что он будет обнаруживать выбросы и обрабатывать их как таковые, поэтому возвращаемая модель будет другой, если есть выбросы.
Уэйн

@Wayne +1 для дополнительной информации о X13-ARIMA SEATS и SEATS / TRAMO.
Грэм Уолш

@Wayne Кстати, еще один «Европейский инструмент» - DEMETRA + .
Грэм Уолш
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.