Я рекомендую статью Роба Хиндмана 1996 года «Вычисление и построение графиков регионов с высокой плотностью» в «Американской статистике» . Вот определение HDR, взятое из этой статьи:
Пусть функция плотности случайной величины . Тогда
HDR - это подмножество выборочного пространства такое, что
где - наибольшая константа, такая что
X 100 ( 1 - α ) % R ( f α ) X R ( f α ) = { x : f ( x ) ≥ f α } , f α P ( X ∈ R ( f α ) ) ≥ 1 - α .е( х )Икс100 ( 1 - α ) %R ( fα)Икс
R ( fα) = { x : f( х ) ≥ fα} ,
еαп( X∈ R ( fα) ) ≥ 1 - α .
Рисунок 1 из этой статьи иллюстрирует разницу между 75% HDR (так что ) и различными другими 75% вероятностными областями для смеси двух нормалей ( - это квантиль, - среднее значение, а - стандартное отклонение плотности):c q q μ σα = 0,25сQQμσ
Идея в одном измерении состоит в том, чтобы взять горизонтальную линию и сдвинуть ее вверх (до ), пока область над ней и под плотностью не станет . Тогда HDR - это проекция на ось этой области.Y= фα1 - αрαИкс
Конечно, все это работает с любой плотностью, будь то байесовский зад или другой.
Вот ссылка на код R, который является hdrcde
пакетом (и на статью о JSTOR).