Мой опыт в основном связан с машинным обучением, и я пытался понять, что означает тестирование байесовской гипотезы. Я согласен с байесовской интерпретацией вероятности и знаком с ней в контексте вероятностных графических моделей. Однако меня смущает то, что означает слово «гипотеза» в контексте статистического вывода.
Я думаю, что я в основном путаюсь со словарем, который я привык в машинном обучении, по сравнению с тем, что обычно используется в статистике и умозаключениях.
В контексте контролируемого обучения , я обычно думаю , что гипотезы в качестве прогностической функции, отображающей примеры его этикетки т.е. . Однако мне кажется, что термин «гипотеза» в тех чтениях, которые я делаю, не имеет того же значения. Позвольте мне вставить выдержку из чтений, которые я читаю:
Если вы внимательно прочитаете, это также говорит:
Существует другая модель для наблюдаемых данных ...
где они используют слово модель. Для меня слово модель заставляет меня думать о наборе функций, где мы выбираем определенную функцию прогнозирования. то есть класс гипотезы функции. Например, может быть классом гипотез квадратичных функций (полином степени 2). Тем не менее, мне кажется, что они используют слово модель и гипотезу как синонимы в этом отрывке (где для меня они совершенно разные слова).
Далее следует упомянуть, что мы можем поставить априорные гипотезы (совершенно разумная вещь в байесовской среде):
также мы можем охарактеризовать данные с текущей гипотезой:
и обновите наши текущие убеждения, учитывая некоторые данные (и правило Байя):
Тем не менее, я думаю, что я более привык помещать байесовскую оценку для определенного параметра (скажем, ) из класса гипотез, а не для всего класса гипотез. В основном, поскольку кажется, что эти «гипотезы» не являются теми же гипотезами из контекста машинного обучения, к которому я привык, мне кажется, что эти гипотезы больше похожи на конкретную θ параметр чем на класс гипотез.
В этот момент я был убежден, что «гипотеза» означает то же самое, что и в функции прогнозирования (например, параметризованной параметром ), но я думаю, что я ошибался ...
Что еще больше усугубило мое замешательство, позже эти же чтения позволили определить конкретную «гипотезу» для каждого обучающего примера, который они наблюдали. Позвольте мне вставить выдержку из того, что я имею в виду:
причина, по которой меня это смущает, заключается в том, что если я интерпретирую гипотезу как параметр, то для меня нет смысла указывать конкретный параметр для каждого значения выборки, которое мы видим. В этот момент я пришел к выводу, что я действительно не знаю, что они подразумевают под гипотезой, поэтому я разместил этот вопрос.
Однако я не сдался полностью, я исследовал, что означает гипотеза в статистике частых посещений, и нашел следующее видео ханской академии . Это видео на самом деле имеет большой смысл для меня (может быть, вы часто! :) . Тем не менее, кажется, что они получают кучу данных (например, некоторый «набор выборок») и на основании свойств набора выборок решают, принимать или отклонять нулевую гипотезу о данных. Однако в байесовском контексте, который я читаю, мне кажется, что для каждого наблюдаемого вектора данных [точки] они «маркируют его» гипотезой «Тест отношения правдоподобия»:
То, как они назначают гипотезу для каждой выборки данных, даже выглядит как контролируемое обучение, когда мы прикрепляем ярлык к каждому обучающему набору. Тем не менее, я не думаю, что это то, что они делают в этом контексте.Что они делают? Что значит назначить гипотезу каждой выборке данных? В чем смысл гипотезы? Что означает слово модель?
По сути, после этого длинного объяснения моей путаницы кто-то знает, что означает тестирование байесовской гипотезы в этом контексте?
Если вам нужны какие-либо разъяснения или что-то еще, чтобы улучшить мой вопрос или чтобы вопрос имел смысл, я более чем рад помочь :)
В поисках ответа я нашел несколько полезных вещей, связанных со статистической проверкой гипотез:
Это хороший пример введения в тему, если вы пришли из CS (как я):
Что является хорошим введением в проверку статистических гипотез для компьютерных ученых?
В какой-то момент я спросил о «параметрах по умолчанию» (которые я должен был определить, что я имел в виду. Я думал, что это стандартный термин, но это не так, поэтому здесь я рассмотрю его), и я думаю, что я действительно имел в виду, как сделать Вы указываете параметры для каждой имеющейся у вас гипотезы. Например, как вы решаете, какова ваша нулевая гипотеза и ее параметры. С этим связан вопрос: