Чтобы дать точные определения, пусть - действительные случайные величины.Икс1, … , XN
Стационарность обычно определяется только в том случае, если мы рассматриваем индекс переменных как время . В этом случае последовательность случайных величин является стационарной из имеет то же распределение, что и . Это подразумевает, в частности, что для имеют одинаковое предельное распределение и, следовательно, одинаковое предельное среднее значение и дисперсию (учитывая, что они имеют конечный второй момент).Икс1, … , Xn - 1Икс2, … , XNИксяя = 1 , … , н
Смысл гетероскедастичности может зависеть от контекста. Если маргинальные дисперсии изменяются с (даже если среднее значение постоянное), случайные величины называются гетероскедастичными в смысле не гомоскедастичности.Иксяя
В регрессионном анализе мы обычно рассматриваем дисперсию ответа условно на регрессоры, и мы определяем гетероскедастичность как непостоянную условную дисперсию.
В анализе временных рядов, где терминология условной гетероскедастичности является общей, обычно интерес представляет дисперсия условно относительно . Если эта условная дисперсия непостоянна, мы имеем условную гетероскедастичность. Модель ARCH (авторегрессионная условная гетероскедастичность) является наиболее известным примером модели стационарных временных рядов с непостоянной условной дисперсией.ИксКИкск - 1, … , X1
Гетероскедастичность (в частности, условная гетероскедастичность) не подразумевает нестационарность в целом.
Стационарность важна по ряду причин. Одно простое статистическое следствие состоит в том, что среднее
является тогда несмещенной оценкой ожидания (и предполагающего эргодичность , которая немного больше чем стационарность и часто подразумевается неявно, среднее является последовательной оценкой ожидания для ).
1NΣя = 1Nе( Хя)
Ее( Х1)n → ∞
Важность гетероскедастичности (или гомоскедастичности) со статистической точки зрения связана с оценкой статистической неопределенности, например, вычислением доверительных интервалов. Если вычисления выполняются в предположении о гомоскедастичности, тогда как данные фактически показывают гетероскедастичность, результирующие доверительные интервалы могут вводить в заблуждение.