Я склонен слышать, что обычно 3 самых больших собственных значения являются самыми важными, в то время как те, которые близки к нулю, являются шумом
Вы можете проверить это. См. Статью в этом посте для более подробной информации. Опять же, если вы работаете с финансовыми временными рядами, вы можете сначала поправить лептокуртичность (то есть рассмотреть серию скорректированных по гархам доходов, а не необработанные доходы).
Я видел несколько научных работ, исследующих, как естественные распределения собственных значений отличаются от вычисленных по матрицам случайной корреляции (опять же, отличая шум от сигнала).
Эдвард:> Обычно можно было бы сделать это по-другому: посмотрите на многовариантное распределение собственных значений (матриц корреляции), поступающих из приложения, которое вы хотите. После того, как вы определили заслуживающего доверия кандидата на распределение собственных значений, их будет довольно легко получить из них.
Наилучшая процедура определения многомерного распределения ваших собственных значений зависит от того, сколько активов вы хотите учесть одновременно (т.е. каковы размеры вашей корреляционной матрицы). Есть хитрый трюк, если ( - количество активов).рр ≤ 10п
Редактировать (комментарии Шаббычефа)
четырехступенчатая процедура:
- Предположим, у вас есть подвыборки многомерных данных. Вам нужен оценщик дисперсионно-ковариационной матрицы для каждого подвыборки (вы можете использовать классический оценщик или надежную альтернативу, такую как быстрый MCD , которая хорошо реализована в matlab, SAS, S, Р,...). Как обычно, если вы работаете с финансовыми временными рядами, вам следует рассмотреть ряд скорректированных по Garch, а не необработанных доходов.˜ C j jJ = 1 , . , , , JС~JJ
- Для каждого образца к югу , вычисляют , ..., , собственные значения из .˜ Λ j = log ( ˜ λ j 1 ) log ( ˜ λ j p ) ˜ C jJΛ~Jзнак равно журнал( λ~J1)журнал( λ~Jп)С~J
- Вычислить , выпуклую оболочку матрицы , j-й элемент которой равен (опять же, это хорошо реализовано в Matlab, R, ...) ,J × p ˜ Λ jСВ( Λ~)J× рΛ~J
- Нарисуйте точки случайным образом изнутри (это делается путем присвоения веса каждому где , где - это ничья из экспоненциального распределения единиц (более подробно здесь ).w i C V ( ˜ Λ ) w i = γ iСВ( Λ~)весяСВ( Λ~) γявеся= γяΣпя = 1γяγя
Ограничение состоит в том, что быстрое вычисление выпуклой оболочки ряда точек становится чрезвычайно медленным, когда число измерений больше 10.J≥ 2