Поздравляем, вы нашли ошибку. Прогнозирование dynlm
с новыми данными нарушается, если используются лаговые переменные. Чтобы понять, зачем смотреть на вывод
predict(model)
predict(model,newdata=data)
Результаты должны быть одинаковыми, но это не так. Без newdata
аргументов predict
функция в основном захватывает model
элемент из dynlm
вывода. С newdata
аргументом predict
пытается сформировать новую модель матрицы из newdata
. Так как это включает в себя формулу синтаксического анализа, которая передается, dynlm
и формула имеет функцию L
, которая определена только внутри функции dynlm
, формируется неправильная матрица модели. Если вы попытаетесь отладить, вы увидите, что в случае newdata
аргумента lagged зависимая переменная не отстает .
Что вы можете сделать, так это отстать от зависимой переменной и включить ее в newdata
. Вот код, иллюстрирующий этот подход. Я использую set.seed
так, чтобы это было легко воспроизводимо.
library(dynlm)
set.seed(1)
y<-arima.sim(model=list(ar=c(.9)),n=10) #Create AR(1) dependant variable
A<-rnorm(10) #Create independant variables
B<-rnorm(10)
C<-rnorm(10)
y<-y+.5*A+.2*B-.3*C #Add relationship to independant variables
data=cbind(y,A,B,C)
#Fit linear model
model<-dynlm(y~A+B+C+L(y,1),data=data)
Вот ошибочное поведение:
> predict(model)
2 3 4 5 6 7 8 9 10
3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738
> predict(model,newdata=data)
1 2 3 4 5 6 7 8 9 10
2.1628335 3.7063579 2.9781417 2.1374301 3.2582376 1.9534558 1.3670995 2.4547626 0.8448223 1.8762437
Форма newdata
#Forecast fix.
A<-c(A,rnorm(1)) #Assume we already have 1-step forecasts for A,B,C
B<-c(B,rnorm(1))
C<-c(C,rnorm(1))
newdata<-ts(cbind(A,B,C),start=start(y),freq=frequency(y))
newdata<-cbind(lag(y,-1),newdata)
colnames(newdata) <- c("y","A","B","C")
Сравните прогноз с подгонкой модели:
> predict(model)
2 3 4 5 6 7 8 9 10
3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738
> predict(model,newdata=newdata)
1 2 3 4 5 6 7 8 9 10 11
NA 3.500667 2.411196 2.627915 2.813815 2.468595 1.733852 2.114553 1.423225 1.470738 1.102367
Как видно из исторических данных, прогноз совпадает, и последний элемент содержит прогноз на 1 шаг вперед.
dynlm
пакета не обеспечит прогнозы для ваших зависимых переменных. Для предоставления прогнозов для ваших зависимых переменных потребуется модель для их объяснения и, возможно, дополнительные данные. Я предлагаю вам прочитать кое-что о многомерной регрессии, например, «Прикладной многомерный статистический анализ» Джонсона и Вихерна. или курс по прогнозированию: duke.edu/~rnau/411home.htm