Надежное многомерное гауссово вписывание в R


11

Мне нужно согласовать обобщенное распределение Гаусса с 7-мерным облаком точек, содержащим довольно значительное число выбросов с высоким кредитным плечом. Вы знаете какой-нибудь хороший пакет R для этой работы?


3
Вы найдете ссылки как минимум на четыре пакета R для определения многовариантных выбросов в ответах на аналогичный вопрос по адресу stats.stackexchange.com/questions/213/… . Это может быть хорошим началом.
whuber

Может быть, вопрос ускользает от меня, но если подходить к многомерному распределению Гаусса, почему бы просто не использовать эмпирическое среднее и SD в качестве MLE? Затем вы можете сосредоточиться на диагностической статистике, если есть высокие точки влияния / рычаги.
AdamO

Ответы:


1

Также есть mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

Однако одно предостережение: смешанное моделирование в многомерном пространстве может потребовать значительных ресурсов процессора и памяти, если ваше облако точек велико. Около четырех лет назад я делал партию 11-мерных данных с точками 50-200 КБ, и они имели тенденцию загружать 4-11 ГБ ОЗУ и занимать до недели для вычислений для каждого случая (а у меня было 400). Это, конечно, возможно, но может быть головной болью, если вы используете общий вычислительный кластер или имеете ограниченные ресурсы.


1

Это звучит как классическая многомерная модель гауссовой смеси. Я думаю, что пакет BayesM может работать.

Вот несколько многомерных пакетов Гауссовой смеси

  • bayesm: cran.r-project.org/web/packages/bayesm/index.html
  • mixtools: www.jstatsoft.org/v32/i06/paper
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.