Что касается комментария Робби МакКиллиама: я думаю, что трудность, с которой часто сталкиваются участники, связана с определением «предшествующего знания», а не со способностью включать предварительные знания в модель. Например, рассмотрите оценку вероятности того, что данная монета выпадет в голову. Давайте предположим, что мои предыдущие знания были, по сути, экспериментом, в котором эта монета была подброшена 10 раз и имела 5 голов, или, возможно, того вида: «Фабрика сделала 1 миллион монет, а расстояние , как определяется огромными экспериментами, является β ( a , b )пβ( а , б )«Каждый использует правило Байеса, когда у вас действительно есть предварительная информация такого типа (правило Байеса просто определяет условную вероятность, это не только байесовская вещь), поэтому в реальной жизни частый и байесовский используют один и тот же подход, и включить информацию в модель с помощью правила Байеса. (Предостережение: если размер вашей выборки не достаточно велик, чтобы вы были уверены, что предшествующая информация не окажет влияния на результаты.) Однако интерпретация результатов Конечно, разные.
Трудность возникает, особенно с философской точки зрения, поскольку знания становятся менее объективными / экспериментальными и более субъективными. Когда это произойдет, частый участник, скорее всего, станет менее склонен вообще включать эту информацию в модель, тогда как байесовский по-прежнему имеет некоторые более или менее формальные механизмы для этого, несмотря на трудности с выявлением субъективного априорного априора.
l ( θ ; x )р ( θ )журналр ( θ )
θ~= максθ{ журналl ( θ ; x ) + logp ( θ ) }
р ( θ )θθ~
Опять же, трудности возникают с философской точки зрения. Зачем выбирать одну функцию регуляризации над другой? Байесовский может сделать это - перейдя к предыдущему представлению - путем оценки предшествующей информации. Частому участнику будет труднее (не сможет?) Оправдать выбор на этих основаниях, но вместо этого он, скорее всего, будет делать это в значительной степени на основе свойств функции регуляризации применительно к его / ее типу проблемы, как выяснилось из совместной работы. работа / опыт многих статистиков. OTOH, (прагматично) байесовцы делают то же самое с приорами - если бы у меня было 100 долларов за каждую статью о приорах для дисперсий, которые я читал ...
Другие «мысли»: я пропустил весь вопрос выбора функции правдоподобия, предполагая, что на нее не влияют частые / байесовские точки зрения. Я уверен, что в большинстве случаев это так, но я могу представить, что в необычных ситуациях это будет, например, по вычислительным соображениям.
θθ