Я бы предложил книгу « Байесовский анализ данных» как отличный источник ответов на этот вопрос (в частности, главу 6) и все, что я собираюсь сказать. Но один из обычных способов, с помощью которых байесовцы решают эту проблему, - это использование задних прогнозирующих значений P (PPP). Прежде чем я расскажу, как PPP решит эту проблему, позвольте мне сначала определить следующую запись:
Пусть - наблюдаемые данные, а θ - вектор параметров. Определим у респ как тиражируемых данных , которые могли бы наблюдавшихся, или, предсказанием думать, как данные мы бы увидеть завтра , если эксперимент , который произвел у сегодня были скопированы с одной и той же модели и тем же значением & thetas , который произвел наблюдаемый данные.YθYрепутацияYθ
Обратите внимание, мы определим распределение учитывая текущее состояние знаний с задним предиктивным распределением
р ( у Rep | у ) = ∫ & thetas ; р ( у Rep | & thetas ; ) р ( & thetas ; | у ) д & thetas ;Yрепутация
р ( урепутация| Y) = ∫Θр ( урепутация| θ)p(θ | y) гθ
Теперь мы можем измерить несоответствие между моделью и данными, определив тестовые величины , аспекты данных, которые мы хотим проверить. Тест количество, или несоответствие мера , , является скалярным резюме параметров и данных, используемыми в качестве эталона при сравнении данных для прогнозирования моделирования. Тестовые величины играют роль в байесовской модели проверки, что тестовая статистика играет в классическом тестировании. Определим обозначение T ( y )T( у, θ )T(у)для тестовой статистики, которая является тестовой величиной, которая зависит только от данных; в байесовском контексте мы можем обобщить статистику теста, чтобы позволить зависимость от параметров модели при их апостериорном распределении.
Классически, p-значение для тестовой статистики равно
p C = Pr ( T ( y rep ) ≥ T ( y ) | θ ),
где берется вероятность для распределения y rep с фиксированным θ .T(у)
пС= Pr ( T( урепутация) ≥ T(у) | θ )
Yрепутацияθ
( θ , урепутация)
пВ= Pr ( T( урепутация, θ ) ≥ T( у, θ ) | Y)
θYрепутацияp ( θ , урепутация| Y)пВ= ∬ΘяT( урепутация, θ ) ≥ T( у| θ)р ( урепутация| θ)p(θ | y) гYрепутацияdθ ,
я
LθYрепутацияθLр ( урепутация, θ | Y)T( у, θL)T( уRep л, θL)L
T( уRep л, θL) ≥ T( у, θL)
л = 1 , . , , , Л
В отличие от классического подхода, проверка байесовской модели не требует специальных методов для обработки «параметров помех». Используя апостериорное моделирование, мы неявно усредняем все параметры в модели.
Дополнительный источник, Эндрю Гельман также имеет очень хороший документ по PPP здесь:
http://www.stat.columbia.edu/~gelman/research/unpublished/ppc_understand2.pdf