Многие люди (кроме специалистов-экспертов), которые считают себя частыми людьми , на самом деле являются байесовскими. Это делает дебаты немного бессмысленными. Я думаю, что байесианство победило, но все еще есть много байесов, которые думают, что они часты. Есть люди, которые думают, что они не используют приоры, и, следовательно, они считают себя частыми. Это опасная логика. Это не столько о приорах (одинаковых или неоднородных), реальная разница более тонкая.
(Формально я не работаю в отделе статистики; мой опыт работы - математика и информатика. Я пишу из-за трудностей, с которыми я пытался обсудить эту «дискуссию» с другими статистиками, и даже с некоторыми ранними работами статистикам.)
MLE на самом деле является байесовским методом. Некоторые люди скажут: «Я частый человек, потому что я использую MLE для оценки своих параметров». Я видел это в рецензируемой литературе. Это бессмыслица и основана на этом (недосказанном, но подразумеваемом) мифе о том, что частый человек - это тот, кто использует единообразный априор вместо неоднородного априорного).
μ=0θ
X≡N(μ=0,σ2=θ)
xθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
xθ
θθx
Это различие между горизонтальными и вертикальными срезами имеет решающее значение, и я обнаружил, что эта аналогия помогла мне понять частый подход к смещению .
Байесовский кто - то , кто говорит
θf(x,θ)
g(θ)
θf(x,θ)g(θ)
Таким образом, байесовский метод фиксирует x и смотрит на соответствующий вертикальный срез в этом контурном графике (или в варианте графика, включающем предыдущий). В этом срезе площадь под кривой не должна быть 1 (как я говорил ранее). Байесовский 95% вероятный интервал (CI) - это интервал, который содержит 95% доступной площади. Например, если область равна 2, то область под байесовским индексом должна составлять 1,9.
θ
θ
N(μ=0,σ2=θ)θx−3θ√+3θ√
θ
Это не единственный способ построить частый CI, он даже не хороший (узкий), но на мгновение потерпите меня.
Лучший способ интерпретировать слово «интервал» - это не интервал на 1-й линии, а думать о нем как об области на 2-й плоскости выше. «Интервал» - это подмножество 2-й плоскости, а не какой-либо 1-й линии. Если кто-то предлагает такой «интервал», мы должны проверить, является ли «интервал» действительным на уровне 95% достоверности / вероятности.
Частый участник проверит правильность этого «интервала», рассматривая каждый горизонтальный срез по очереди и просматривая область под кривой. Как я уже говорил, площадь под этой кривой всегда будет одна. Важнейшим требованием является, чтобы площадь в пределах «интервала» была не менее 0,95.
Байесовский проверит правильность, взглянув на вертикальные срезы. Опять же, площадь под кривой будет сравниваться с подрайоном, который находится под интервалом. Если последний составляет не менее 95% от первого, то «интервал» является действительным 95% -ным байесовским вероятным интервалом.
Теперь, когда мы знаем, как проверить, является ли определенный интервал «действительным», вопрос заключается в том, как выбрать лучший вариант среди допустимых. Это может быть черным искусством, но обычно вам нужен самый узкий интервал. Оба подхода имеют тенденцию соглашаться - вертикальные срезы рассматриваются, и цель состоит в том, чтобы сделать интервал как можно более узким в пределах каждого вертикального среза.
Я не пытался определить максимально узкий интервал доверительной вероятности в приведенном выше примере. Посмотрите комментарии @cardinal ниже для примеров более узких интервалов. Моя цель - не найти лучшие интервалы, а подчеркнуть разницу между горизонтальными и вертикальными срезами при определении достоверности. Интервал, который удовлетворяет условиям 95-процентного доверительного доверительного интервала, обычно не удовлетворяет условиям 95-процентного байесовского доверительного интервала, и наоборот.
Оба подхода требуют узких интервалов, т.е. при рассмотрении одного вертикального среза мы хотим, чтобы интервал (1-d) в этом срезе был как можно более узким. Разница заключается в том, как обеспечивается соблюдение 95% - частый сотрудник будет смотреть только на предлагаемые интервалы, когда 95% площади каждого горизонтального среза находится под интервалом, тогда как байесовский будет настаивать на том, чтобы каждый вертикальный срез был таким, чтобы 95% его площади под интервалом.
Многие не статистики не понимают этого, и они сосредоточены только на вертикальных срезах; это делает их байесовцами, даже если они думают иначе.