Оценка случайного блуждания с AR (1)


10

Когда я оцениваю случайное блуждание с AR (1), коэффициент очень близок к 1, но всегда меньше.

Какова математическая причина того, что коэффициент не больше единицы?


Я пробовал использовать набор инструментов Matlab, а также свой скрипт на arima (где коэффициент ограничен [-10,10] и результат тот же). Я пытаюсь с простой OLS, и результат тот же.
Марко

Оценка смещена вниз, мы должны прочитать статью Дики и Фуллера.
Марко

Ответы:


12

По МНК мы оцениваем модель

xt=ρxt1+ut,E(ut{xt1,xt2,...})=0,x0=0

Для выборки размера T оценка составляет

ρ^=t=1Txtxt1t=1Txt12=ρ+t=1Tutxt1t=1Txt12

Если механизм генерации истинных данных является чисто случайным блужданием, то , иρ=1

ИксTзнак равноИксT-1+UTИксTзнак равноΣязнак равно1TUя

Распределение выборки МНК - оценки, или , что эквивалентно, распределение выборки р - 1 , не является симметричным около нуля, а это перекос влево от нуля, с 68 % от полученных значений (т.е. вероятность массы) отрицательна, и поэтому мы получаем чаще всего ρ < 1 . Вот относительное распределение частотρ^-168ρ^<1

введите описание изображения здесь

Жадный:-0.0017773Медиана:-0.00085984Минимум: -0.042875Максимум: 0.0052173Среднеквадратичное отклонение: 0.0031625Асимметрия: -2,2568Ex. эксцесс: 8,3017

Это иногда называют распределением «Дики-Фуллера», потому что оно является базой для критических значений, используемых для выполнения тестов с единичным корнем с тем же именем.

Я не помню, чтобы видел попытку обеспечить интуицию для формы распределения выборки. Мы смотрим на выборочное распределение случайной величины

ρ^-1знак равно(ΣTзнак равно1TUTИксT-1)(1ΣTзнак равно1TИксT-12)

UTρ^-1ρ^-1

Tзнак равно5

Если мы суммируем независимые Нормы Продукта, мы получим распределение, которое остается симметричным относительно нуля. Например:

введите описание изображения здесь

Но если мы суммируем независимые Нормы Продукта, как в нашем случае, мы получим

введите описание изображения здесь

который смещен вправо, но с большей вероятностью, распределенной по отрицательным значениям. И масса, кажется, будет сдвинута еще больше влево, если мы увеличим размер выборки и добавим больше связанных элементов к сумме.

Обратная величина суммы несамостоятельных гамм является неотрицательной случайной величиной с положительным перекосом.

ρ^-1


Вау, хороший анализ! Не могли бы вы указать, какое из стандартных допущений OLS здесь нарушено?
Ричард Харди

@RichardHardy Спасибо. Я вернусь позже, чтобы ответить на ваш комментарий.
Алекос Пападопулос

Мне все еще интересно узнать о предположениях OLS ... Заранее спасибо!
Ричард Харди

ИксT+1знак равноαИксT+εИксT+1-ИксT

ρ^<1ρ^-1

6

Это не совсем ответ, но слишком длинный для комментария, поэтому я все равно отправляю.

Мне удалось получить коэффициент больше, чем 1 два раза из ста для выборки размером 100 (используя «R»):

N=100                   # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~y[-T])    # regress y on its own first lag, with intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

Реализации 84 и 95 имеют коэффициент выше 1, поэтому он не всегда ниже единицы. Тем не менее, явно прослеживается тенденция к снижению оценки. Остается вопрос, почему ?

Изменить: вышеупомянутые регрессии включали термин перехват, который, кажется, не принадлежит модели. Как только перехват удален, я получаю намного больше оценок выше 1 (3158 из 10000) - но все же оно явно ниже 50% всех случаев:

N=10000                 # number of trials
T=100                   # length of time series
coef=c()
for(i in 1:N){
 set.seed(i)
 x=rnorm(T)             # generate T realizations of a standard normal variable
 y=cumsum(x)            # cumulative sum of x produces a random walk y
 lm1=lm(y[-1]~-1+y[-T]) # regress y on its own first lag, without intercept
 coef[i]=as.numeric(lm1$coef[1])
}
length(which(coef<1))/N # the proportion of estimated coefficients below 1

точно, не "всегда" незначительный, но в большинстве случаев. Это явно ложный результат. почему причина?
Марко

2
ИксTИксT-1
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.