Вопрос: С 10-мерной цепочкой MCMC, скажем, я готов передать вам матрицу розыгрышей: 100 000 итераций (строк) по 10 параметрам (столбцам), как лучше всего определить апостериорные моды? Я особенно обеспокоен несколькими режимами.
Фон:Я считаю себя статистически подкованным статистиком, но когда коллега задал мне этот вопрос, мне стало стыдно, что я не смог придумать разумного ответа. Основная проблема заключается в том, что могут появиться несколько режимов, но только если учитываются как минимум восемь или около того из десяти измерений. Моей первой мыслью было бы использовать оценку плотности ядра, но поиск по R не выявил ничего многообещающего для задач более трех измерений. Коллега предложил специальную стратегию биннинга в десяти измерениях и поиска максимума, но меня беспокоит то, что пропускная способность может привести к серьезным проблемам с разреженностью или к отсутствию разрешения для распознавания нескольких режимов. Тем не менее, я бы с радостью принял предложения для предложений по автоматической пропускной способности, ссылки на оценщик плотности ядра 10 или что-нибудь еще, о чем вы знаете.
проблемы:
Мы считаем, что распределение может быть весьма искажено; следовательно, мы хотим идентифицировать задний способ (а), а не задний способ.
Мы обеспокоены тем, что может быть несколько задних мод.
Если возможно, мы бы предпочли предложение на основе R. Но любой алгоритм подойдет, если его не сложно реализовать. Думаю, я бы предпочел не реализовывать оценщик плотности ядра Nd с автоматическим выбором полосы пропускания с нуля.