Что такое байесовский эквивалент общего теста на пригодность?


25

У меня есть два набора данных, один из набора физических наблюдений (температуры), и один из множества численных моделей. Я делаю анализ совершенной модели, предполагая, что ансамбль модели представляет собой истинную, независимую выборку, и проверяю, получены ли наблюдения из этого распределения. Рассчитанная мной статистика нормализована и теоретически должна быть стандартным нормальным распределением. Конечно, он не идеален, поэтому я хочу проверить его на пригодность.

Используя частые рассуждения, я мог бы вычислить статистику Крамера-фон Мизеса (или Колмогорова-Смирнова и т. Д.) Или аналогичную и найти значение в таблице, чтобы получить значение p, чтобы помочь мне решить, насколько маловероятно значение I Видите ли, учитывая наблюдения совпадают с моделью.

Каким будет байесовский эквивалент этого процесса? То есть как я могу измерить силу моей уверенности в том, что эти два распределения (моя вычисленная статистика и стандартная норма) различны?


Что - то вроде этого может соответствовать требованиям.
Cyan

Ответы:


23

Я бы предложил книгу « Байесовский анализ данных» как отличный источник ответов на этот вопрос (в частности, главу 6) и все, что я собираюсь сказать. Но один из обычных способов, с помощью которых байесовцы решают эту проблему, - это использование задних прогнозирующих значений P (PPP). Прежде чем я расскажу, как PPP решит эту проблему, позвольте мне сначала определить следующую запись:

Пусть - наблюдаемые данные, а θ - вектор параметров. Определим у респ как тиражируемых данных , которые могли бы наблюдавшихся, или, предсказанием думать, как данные мы бы увидеть завтра , если эксперимент , который произвел у сегодня были скопированы с одной и той же модели и тем же значением & thetas , который произвел наблюдаемый данные.YθYрепутацияYθ

Обратите внимание, мы определим распределение учитывая текущее состояние знаний с задним предиктивным распределением р ( у Rep | у ) = & thetas ; р ( у Rep | & thetas ; ) р ( & thetas ; | у ) д & thetas ;Yрепутация

п(Yрепутация|Y)знак равноΘп(Yрепутация|θ)п(θ|Y)dθ

Теперь мы можем измерить несоответствие между моделью и данными, определив тестовые величины , аспекты данных, которые мы хотим проверить. Тест количество, или несоответствие мера , , является скалярным резюме параметров и данных, используемыми в качестве эталона при сравнении данных для прогнозирования моделирования. Тестовые величины играют роль в байесовской модели проверки, что тестовая статистика играет в классическом тестировании. Определим обозначение T ( y )T(Y,θ)T(Y)для тестовой статистики, которая является тестовой величиной, которая зависит только от данных; в байесовском контексте мы можем обобщить статистику теста, чтобы позволить зависимость от параметров модели при их апостериорном распределении.

Классически, p-значение для тестовой статистики равно p C = Pr ( T ( y rep ) T ( y ) | θ ), где берется вероятность для распределения y rep с фиксированным θ .T(Y)

пСзнак равноPr(T(Yрепутация)T(Y)|θ)
Yрепутацияθ

(θ,Yрепутация)

пВзнак равноPr(T(Yрепутация,θ)T(Y,θ)|Y)
θYрепутацияп(θ,Yрепутация|Y)
пВзнак равноΘяT(Yрепутация,θ)T(Y|θ)п(Yрепутация|θ)п(θ|Y)dYрепутацияdθ,
я

LθYрепутацияθLп(Yрепутация,θ|Y)T(Y,θL)T(YрепутацияL,θL)L

T(YрепутацияL,θL)T(Y,θL)
Lзнак равно1,,,,,L

В отличие от классического подхода, проверка байесовской модели не требует специальных методов для обработки «параметров помех». Используя апостериорное моделирование, мы неявно усредняем все параметры в модели.

Дополнительный источник, Эндрю Гельман также имеет очень хороший документ по PPP здесь: http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf


3

Одна относительно простая возможность: гладкие тесты на пригодность подгонки, например, [1] - которые обрамляют альтернативу с точки зрения плавных отклонений от нуля, построенных ортогональными многочленами (относительно нулевой плотности как весовой функции), будут относительно простыми для переход к байесовскому каркасу, так как коэффициенты полиномов образуют гибкое, но параметрическое расширение нуля.

[1]: Rayner, JCW и DJ Best (1990),
«Плавные тесты на пригодность: обзор»,
Международный статистический обзор , 58 : 1 (апрель), с. 9-17.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.