Я продолжаю читать о необходимости проверки автокорреляции в MCMC. Почему важно, чтобы автокорреляция была низкой? Что это измеряет в контексте MCMC?
Я продолжаю читать о необходимости проверки автокорреляции в MCMC. Почему важно, чтобы автокорреляция была низкой? Что это измеряет в контексте MCMC?
Ответы:
Автокорреляция - это мера того, насколько значение сигнала соотносится с другими значениями этого сигнала в разные моменты времени. В контексте MCMC автокорреляция является мерой того, насколько независимы разные выборки от вашего апостериорного распределения - более низкая автокорреляция указывает на более независимые результаты.
Когда у вас высокая автокорреляция, отобранные вами образцы не точно представляют апостериорное распределение и, следовательно, не дают столь значимой информации для решения проблемы. Другими словами, более низкая автокорреляция означает более высокую эффективность в ваших цепях и лучшие оценки. Общее правило состоит в том, что чем ниже ваша автокорреляция, тем меньше выборок необходимо для того, чтобы метод был эффективным (но это может быть слишком упрощенным).
Во-первых, и наиболее очевидно, что если автокорреляция высока, то N выборок не дают вам N фрагментов информации о вашем распределении, но меньше, чем эта. Эффективный размер выборки (ESS) является одним из показателей того, сколько информации вы действительно получаете (и является функцией параметра автокорреляции).
Кроме того, автокорреляция дает вам непредставительные образцы «в краткосрочной перспективе». Более того, чем больше автокорреляция, тем дольше этот «короткий пробег». Для очень сильной автокорреляции короткая пробежка может быть хорошей частью ваших общих выборок. Обычные прямые меры - это повторная параметризация или параметры выборки, которые, как вы ожидаете, будут взаимно коррелироваться в блоках, а не по отдельности, поскольку в противном случае они будут генерировать автокорреляцию в цепочке. Люди часто также «худые», хотя есть некоторая дискуссия о том, насколько это полезно для решения основной проблемы, например, здесь . Kass 1997 - это неформальное обсуждение проблем, хотя, возможно, есть что-то более новое, что другие могут порекомендовать.
Короче говоря, для сильно автокоррелированной цепочки требуется больше времени, чтобы перейти от ее начальных условий к нужному целевому распределению, при этом она менее информативна и требует больше времени для изучения этого распределения, когда оно туда попадает.