Что такое байесовский эквивалент общего теста на пригодность?

25

У меня есть два набора данных, один из набора физических наблюдений (температуры), и один из множества численных моделей. Я делаю анализ совершенной модели, предполагая, что ансамбль модели представляет собой истинную, независимую выборку, и проверяю, получены ли наблюдения из этого распределения. Рассчитанная мной статистика нормализована и теоретически должна быть стандартным нормальным распределением. Конечно, он не идеален, поэтому я хочу проверить его на пригодность.

Используя частые рассуждения, я мог бы вычислить статистику Крамера-фон Мизеса (или Колмогорова-Смирнова и т. Д.) Или аналогичную и найти значение в таблице, чтобы получить значение p, чтобы помочь мне решить, насколько маловероятно значение I Видите ли, учитывая наблюдения совпадают с моделью.

Каким будет байесовский эквивалент этого процесса? То есть как я могу измерить силу моей уверенности в том, что эти два распределения (моя вычисленная статистика и стандартная норма) различны?

bayesian goodness-of-fit

— naught101
источник

Что - то вроде этого может соответствовать требованиям.

— Cyan

23

Я бы предложил книгу « Байесовский анализ данных» как отличный источник ответов на этот вопрос (в частности, главу 6) и все, что я собираюсь сказать. Но один из обычных способов, с помощью которых байесовцы решают эту проблему, - это использование задних прогнозирующих значений P (PPP). Прежде чем я расскажу, как PPP решит эту проблему, позвольте мне сначала определить следующую запись:

Пусть - наблюдаемые данные, а - вектор параметров. Определим как тиражируемых данных , которые могли бы наблюдавшихся, или, предсказанием думать, как данные мы бы увидеть завтра , если эксперимент , который произвел сегодня были скопированы с одной и той же модели и тем же значением & , который произвел наблюдаемый данные. $y$ $\theta$ $y^{\text{rep}}$ $y$ $\theta$

Обратите внимание, мы определим распределение учитывая текущее состояние знаний с задним предиктивным распределением $y^{\text{rep}}$

п (Y^{репутация} | Y) знак равно \int_{Θ} п (Y^{репутация} | θ) п (θ | Y) d θ

$p(y^{\text{rep}}|y)=\int_\Theta p(y^{\text{rep}}|\theta)p(\theta|y)d\theta$

Теперь мы можем измерить несоответствие между моделью и данными, определив тестовые величины , аспекты данных, которые мы хотим проверить. Тест количество, или несоответствие мера , , является скалярным резюме параметров и данных, используемыми в качестве эталона при сравнении данных для прогнозирования моделирования. Тестовые величины играют роль в байесовской модели проверки, что тестовая статистика играет в классическом тестировании. Определим обозначение $T(y,\theta)$ $T(y)$ для тестовой статистики, которая является тестовой величиной, которая зависит только от данных; в байесовском контексте мы можем обобщить статистику теста, чтобы позволить зависимость от параметров модели при их апостериорном распределении.

Классически, p-значение для тестовой статистики равно где берется вероятность для распределения с фиксированным . $T(y)$

п_{С} знак равно Pr (T (Y^{репутация}) \geq T (Y) | θ)

$p_C=\text{Pr}(T(y^{\text{rep}})\geq T(y)|\theta)$

y^{rep}

$y^{\text{rep}}$

θ

$\theta$

$(\theta,y^{\text{rep}})$

п_{В} знак равно Pr (T (Y^{репутация}, θ) \geq T (Y, θ) | Y)

$p_B=\text{Pr}(T(y^{\text{rep}},\theta)\geq T(y,\theta)|y)$

θ

$\theta$

y^{rep}

$y^{\text{rep}}$

p (θ, y^{rep} | y)

$p(\theta,y^{\text{rep}}|y)$

п_{В} знак равно \iint_{Θ} я_{T (Y^{репутация}, θ) \geq T (Y | θ)} п (Y^{репутация} | θ) п (θ | Y) d Y^{репутация} d θ,

$p_B=\iint_\Theta I_{T(y^{\text{rep}},\theta)\geq T(y|\theta)}p(y^{\text{rep}}|\theta)p(\theta|y)dy^{\text{rep}}d\theta,$

I

$I$

$L$ $\theta$ $y^{\text{rep}}$ $\theta$ $L$ $p(y^{\text{rep}},\theta|y)$ $T(y,\theta^l)$ $T(y^{\text{rep}l},\theta^l)$ $L$

T (Y^{репутация L}, θ^{L}) \geq T (Y, θ^{L})

$T(y^{\text{rep}l},\theta^l)\geq T(y,\theta^l)$

l = 1, . . ., L

$l=1,...,L$

В отличие от классического подхода, проверка байесовской модели не требует специальных методов для обработки «параметров помех». Используя апостериорное моделирование, мы неявно усредняем все параметры в модели.

Дополнительный источник, Эндрю Гельман также имеет очень хороший документ по PPP здесь: http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf

— fsociety
источник

3

Одна относительно простая возможность: гладкие тесты на пригодность подгонки, например, [1] - которые обрамляют альтернативу с точки зрения плавных отклонений от нуля, построенных ортогональными многочленами (относительно нулевой плотности как весовой функции), будут относительно простыми для переход к байесовскому каркасу, так как коэффициенты полиномов образуют гибкое, но параметрическое расширение нуля.

[1]: Rayner, JCW и DJ Best (1990),
«Плавные тесты на пригодность: обзор»,
Международный статистический обзор , 58 : 1 (апрель), с. 9-17.

— Glen_b - Восстановить Монику
источник