Правдоподобие байесовский с плоским до≠
Функция правдоподобия и связанный с ней доверительный интервал не совпадают (концепция) с байесовской апостериорной вероятностью, построенной с априором, который задает равномерное распределение.
В частях 1 и 2 этого ответа утверждается, почему вероятность не следует рассматривать как байесовскую апостериорную вероятность, основанную на плоском априоре.
В части 3 приведен пример, в котором доверительный интервал и вероятный интервал широко варьируются. Также указывается, как возникает это несоответствие.
1 Разное поведение при преобразовании переменной
Вероятности трансформируются особым образом . Если мы знаем распределение вероятности то мы также знаем распределение для переменной определенной любой функцией , согласно правилу преобразования:fx(x)fξ(ξ)ξx=χ(ξ)
fξ(ξ)=fx(χ(ξ))dχdξdξ
Если вы преобразуете переменную, то среднее значение и режим могут отличаться из-за этого изменения функции распределения. Это означает, что и .x¯≠χ(ξ¯)xmaxf(x)≠χ(ξmaxf(ξ))
Функция правдоподобия не преобразуется таким образом . Это контрасты между функцией правдоподобия и апостериорной вероятностью. Функция правдоподобия (максимум) остается неизменной при преобразовании переменной.
Lξ(ξ)=Lx(χ(ξ))
Связанный:
Плоский априор неоднозначен . Это зависит от формы конкретной статистики.
Например, если равномерна распределена (например , то является не однородным распределенным переменным.XU(0,1))X2
Не существует ни одной квартиры до, с которой вы могли бы связать функцию правдоподобия. Он отличается , когда вы определяете плашмя перед для или некоторые преобразованные переменной как . По всей вероятности, такой зависимости не существует.XX2
Границы вероятностей (интервалы вероятности) будут разными при преобразовании переменной (для функций правдоподобия это не так) . Например, для некоторого параметра и монотонного преобразования (например, логарифм) вы получаете эквивалентные интервалы правдоподобия
af(a)мин <aminf(amin)<<af(a)<<amaxf(amax)
2 Другая концепция: доверительные интервалы не зависят от предыдущих
Предположим, вы выбираете переменную из совокупности с (неизвестным) параметром которая сама (совокупность с параметром ) отбирается из суперпопуляции (возможно, с различными значениями для ).Xθθθ
Можно сделать обратное утверждение пытается сделать вывод о том , что оригинал , возможно, был основан на наблюдение некоторых значений для переменной .θxiX
- Байесовская метода сделать это, допуская априорное распределение для распределения возможныхθ
- Это контрастирует с функцией правдоподобия и доверительным интервалом, которые не зависят от предыдущего распределения.
Доверительный интервал не использует информацию априора, как достоверный интервал (достоверность не является вероятностью).
Независимо от предшествующего распределения (равномерное или нет) интервал x% -доверности будет содержать истинный параметр в случаевx (доверительные интервалы относятся к коэффициенту успеха, ошибке I типа, метода, а не конкретного случая) ,
В случае вероятного интервала это понятие ( времени, в котором интервал содержит истинный параметр) даже не применимо, но мы можем интерпретировать его в частом смысле, а затем мы видим, что вероятный интервал будет содержать только истинный параметр времени, когда (равномерное) предшествующее значение правильно описывает суперпопуляцию параметров, с которыми мы можем столкнуться. Интервал может эффективно работать выше или ниже, чем x% (не то, чтобы это имело значение, поскольку байесовский подход отвечает на разные вопросы, но это просто для того, чтобы отметить разницу).x
3 Разница между доверием и достоверными интервалами
В приведенном ниже примере мы исследуем функцию правдоподобия для экспоненциального распределения как функцию параметра скорости , среднего значения выборки и размера выборки :λx¯n
L(λ,x¯,n)=nn(n−1)!xn−1λne−λnx¯
эта функция выражает вероятность наблюдать (для данного и ) выборочное среднее между и .nλx¯x¯+dx
примечание: параметр скорости изменяется от до (в отличие от OP 'request' от до ). Приор в этом случае будет ненадлежащим приором . Принципы, однако, не меняются. Я использую эту перспективу для упрощения иллюстрации. Распределения с параметрами от до часто являются дискретными (трудно рисовать непрерывные линии) или бета-распределением (сложно рассчитать)λ0∞0101
Изображение ниже иллюстрирует эту функцию правдоподобия (карта синего цвета) для размера выборки , а также рисует границы для интервалов 95% (как достоверных, так и достоверных).n=4
Границы создаются с получением (одномерной) кумулятивной функции распределения. Но эта интеграция / накопление может быть сделано в двух направлениях .
Разница между интервалами происходит потому, что 5% площади сделаны по-разному.
95-процентный доверительный интервал содержит значения для которых наблюдаемое значение встречается как минимум в 95% случаев. Этим способом. Независимо от значения , мы ошиблись бы только в 95% случаев.λx¯λ
Для любой вас есть север и юг от границ (изменение ) 2,5% от веса функции правдоподобия.λx¯
Доверительный интервал 95% содержит значения которые, скорее всего, вызывают наблюдаемое значение (с учетом предшествующего фиксированного значения)λx¯
Даже когда наблюдаемый результат менее чем на 5% вероятен для данного , конкретный может находиться внутри вероятного интервала. В конкретном примере более высокие значения являются «предпочтительными» для вероятного интервала.x¯λλλ
Для любого вас есть запад и восток от границ (изменение ) 2,5% от веса функции правдоподобия.x¯λ
Случай, когда доверительный интервал и вероятный интервал (на основе неправильного априорного значения) совпадают, предназначен для оценки среднего значения гауссовой распределенной переменной (распределение показано здесь: https://stats.stackexchange.com/a/351333/164061 ).
Очевидный случай, когда доверительный интервал и вероятный интервал не совпадают, иллюстрируется здесь ( https://stats.stackexchange.com/a/369909/164061 ). Доверительный интервал для этого случая может иметь одну или даже обе (верхнюю / нижнюю) границы на бесконечности.