Функция правдоподобия определяется независимо друг от или до статистической парадигмы, которая используется для вывода, как функция, (или ), параметра , функции что зависит от или индексируется смотровой (с) для этого вывода. А также неявно в зависимости от семейства вероятностных моделей, выбранных для представления изменчивости или случайности в данных. Для данного значения пары значение этой функции точно совпадает со значением плотности модели в−L ( θ ; x ) L ( θ | x ) θ - - x ( θ , x ) x θ−L(θ;x)L(θ|x)θ−−x(θ,x)xкогда индексируется параметром . θЧто часто грубо переводится как «вероятность данных».
Чтобы процитировать больше авторитетных и исторических источников, чем более ранний ответ на этом форуме,
«Мы можем обсудить вероятность появления величин, которые можно наблюдать ... в отношении любых гипотез, которые могут быть предложены для объяснения этих наблюдений. Мы ничего не можем знать о вероятности гипотез ... [Мы] можем установить вероятность гипотез ... путем расчета из наблюдений: ... говорить о вероятности ... наблюдаемой величины не имеет смысла ". Р. А. Фишер. О «вероятной ошибке» коэффициента корреляции, выведенного из небольшой выборки . Метрон 1, 1921, с.25
а также
«Что мы можем найти из выборки, так это вероятность любого конкретного значения r, если мы определим вероятность как величину, пропорциональную вероятности того, что из совокупности, имеющей конкретное значение r, выборка, имеющая наблюдаемое значение r , должен быть получен ". Р. А. Фишер. О «вероятной ошибке» коэффициента корреляции, выведенного из небольшой выборки . Метрон 1, 1921, с.24
который упоминает пропорциональность, которую Джеффрис (и я) находят излишним:
«Вероятность, удобный термин, введенный профессором Р.А. Фишером, хотя при его использовании он иногда умножается на постоянный коэффициент. Это вероятность наблюдений с учетом исходной информации и обсуждаемой гипотезы». Х. Джеффрис, Теория вероятностей , 1939, с.28
Процитирую только одно предложение из превосходного исторического вступления в тему Джона Олдрича (Статистическая наука, 1997):
«Фишер (1921, стр. 24) переписал то, что он написал в 1912 году об обратной вероятности, различая математические операции, которые могут быть выполнены с плотностями вероятности и вероятностями: вероятность не является« дифференциальным элементом », его нельзя интегрировать «. Дж. Олдрич, Р. А. Фишер и создание максимального правдоподобия 1912 - 1922 , 1997 , с.9
При принятии байесовского подхода функция правдоподобия не изменяется ни по форме, ни по природе. Это продолжает быть плотность в индексированной . Дополнительная особенность заключается в том, что, поскольку также наделено вероятностной моделью, то предварительное распределение, плотность в индексированная также можно интерпретировать как условную плотность, обусловленную реализацией : в байесовском моделировании. , одна реализация получается из предшествующей, с плотностью , затем реализация ,xθθxθθθπ(⋅)Xx, получается из распределения с плотностью , проиндексированного . Другими словами, и относительно надлежащей доминирующей меры, пара имеет общую плотность
из которой получается апостериорная плотность , то есть условная плотность , обусловленная реализацией как
также выражается как
найденный со времен Джеффриса (1939) .L(θ|⋅)θ(θ,x)
π(θ)×L(θ|x)
θθxπ(θ|x)∝π(θ)×L(θ|x)
posterior∝prior×likelihood
Примечание: я нахожу различие, сделанное во введении на странице Википедии о функциях вероятности между вероятностными и байесовскими вероятностями, запутанным и ненужным, или просто ошибочным, поскольку подавляющее большинство современных байесовских статистиков не использует вероятность в качестве замены апостериорной вероятности. Точно так же «разница» , указанная на странице Википедии о теореме Байеса, звучит более запутанно, чем что-либо еще, поскольку эта теорема является вероятностным утверждением об изменении обусловленности, независимой от парадигмы или значения вероятностного утверждения. ( На мой взгляд , это скорее определение, чем теорема!)