Кто частые?


55

У нас уже была ветка, спрашивающая, кто такие байесовцы, и одна, спрашивающая, являются ли частые лица байесовскими , но не было ветки, спрашивающей, кто такие частые ? Этот вопрос был задан @whuber в качестве комментария к этой теме, и он требует ответа. Существуют ли они (есть ли самоидентифицированные частисты)? Может быть, их просто придумали байесовцы, которым нужно было обвинить козла отпущения при критике основной статистики?

Мета-комментарий к ответам, которые уже были даны: в отличие от этого, байесовская статистика определяется не только с точки зрения использования теоремы Байеса (не байесовцы также используют ее), ни использования субъективистской интерпретации вероятности (вы бы не назвали какого-либо непрофессионала говоря что-то вроде «Бьюсь об заклад, шанс меньше 50:50!» ( байесовский) - так можем ли мы определить частоту только с точки зрения принятой интерпретации вероятности? Кроме того, статистика применяется вероятность , поэтому следует определение frequentism быть сосредоточены исключительно на интерпретации вероятности?


10
Я все еще хотел бы знать, что такое «Частый»? Я видел, что этот термин использовался как очевидная ссылка на «любого не байесовского», а также на кого-то, кто присоединяется к вероятностной философии Фриациста. Я знаю, что есть много первых, но я не уверен, что есть живые представители последних!
whuber

9
Подсчитайте меня как частого человека, пожалуйста. Давайте объединяться! Вместе мы будем сильны, чтобы уничтожить байесовский у ворот раз и навсегда!
Аксакал

10
@ Аксакал повторяю это бесконечное количество раз, и я буду считать это значительным;)
Тим

5
Осторожнее кого ты называешь Байесовским. Согласно Д.В. Линдли, «нет никого менее байесовского, чем эмпирический байесовский». Многие пользователи так называемых байесовских методов на самом деле не байесовские. Теперь с быстрыми компьютерами и MCMC все вдруг стали байесовскими? Для многих это просто другой расчет, как и любой другой, а не глубокая философия. Распределено население попарно и только между частыми и байесовскими. Как насчет кого-то без соответствующего образования, что они? Может ли быть степень (или частота) байесовости? Может быть разные в разные дни недели или виды анализа?
Марк Л. Стоун

10
Тим, я боюсь, что этот поток может быть затронут той же путаницей, что и некоторые связанные потоки: а именно, существуют статистические методы, основанные на частоте против байесовской, и интерпретации вероятности часто встречающиеся против байесовских. Это две разные проблемы! О ком ты спрашиваешь? Путаница очевидна уже сейчас, в комментариях к ответу @ fcop; fcop говорит об определении / интерпретации вероятности, тогда как вы упомянули OLS, а речь идет о статистических методах.
говорит амеба, восстанови Монику

Ответы:


35

Некоторые существующие ответы говорят о статистическом выводе, а некоторые - об интерпретации вероятности, и ни один из них не проводит четкого различия. Основная цель этого ответа - провести это различие.


Слово «частота» (и «частик») может относиться к ДВУМЯ РАЗНЫМ ВЕЩАМ:

  1. Одним из них является вопрос о том, что такое определение или толкование «вероятности». Есть многократные интерпретации, "частое толкование", являющееся одним из них. Частыми были бы люди, придерживающиеся этой интерпретации.

  2. Другой - статистический вывод о параметрах модели, основанный на данных наблюдений. Существует байесовский и частичный подходы к статистическому выводу, и частыми лицами будут люди, предпочитающие использовать частотный подход.

Теперь приходит предположение: я думаю, что почти нет частых лиц первого типа (P-частые люди ) , но есть много частых людей второго типа (S-частые люди ) .


Частое толкование вероятности

Вопрос о том, что такое вероятность, является предметом интенсивных дебатов с более чем 100-летней историей. Это относится к философии. Я отсылаю всех, кто не знаком с этими дебатами, к статье « Интерпретации вероятности» в Стэнфордской энциклопедии философии, которая содержит раздел о частых интерпретациях. Еще одно очень удобочитаемое описание, о котором мне довелось узнать, - эта статья: Appleby, 2004, «Вероятность - это единичный случай или ничего», которая написана в контексте основ квантовой механики, но содержит разделы, посвященные вероятности.

Эпплби пишет:

Частота - это позиция, в которой утверждение о вероятности эквивалентно утверждению о частоте в некотором подходяще выбранном ансамбле. Например, согласно фон Мизесу [21, 22], утверждение «вероятность того, что эта монета выпадет с головами 0,5» эквивалентно утверждению «в бесконечной последовательности бросков эта монета сходит с головы с предельной относительной частотой 0,5». ,

Это может показаться разумным, но в этом определении так много философских проблем, что вряд ли кто-то знает, с чего начать. Какова вероятность, что завтра будет дождь? Бессмысленный вопрос, потому что как бы у нас была бесконечная последовательность испытаний. Какова вероятность того, что монета в моем кармане всплывет? Вы говорите, что относительная частота голов в бесконечной последовательности бросков? Но монета исчезнет, ​​и Солнце станет сверхновой, прежде чем бесконечная последовательность может быть закончена. Таким образом, мы должны говорить о гипотетической бесконечной последовательности. Это приводит к обсуждению референтных классов и т. Д. И т. Д. В философии не так легко уйти. И, кстати, почему вообще должен существовать лимит?

Кроме того, что, если моя монета выпадет в голову в 50% случаев в течение первого миллиарда лет, а затем начнет выпадать в голову только в 25% случаев (мысленный эксперимент от Appleby)? Это означает, что по определению. Но мы всегда будем наблюдать в течение следующего миллиарда лет. Как вы думаете, такая ситуация на самом деле не возможна? Конечно, но почему? Потому что не может внезапно измениться? Но это предложение не имеет смысла для P-частых.F т е д у по электронной п с у ( Н е д ы ) 1 / 2 Р ( Н е д ы )P(Heads)=1/4Frequency(Heads)1/2P(Heads)

Я хочу, чтобы этот ответ был коротким, поэтому я остановился здесь; см. выше для ссылок. Я думаю, что действительно трудно быть несгибаемым P-частым участником.

(Обновление: в комментариях ниже, @mpiktas настаивает на том, что это потому, что определение частоты часто математически бессмысленно. Мое мнение, высказанное выше, скорее состоит в том, что определение частоты часто философски проблематично.)


Частый подход к статистике

Рассмотрим вероятностную модель , который имеет некоторые параметры и позволяет вычислить вероятность данных наблюдений . Вы сделали эксперимент и наблюдали некоторые данные . Что вы можете сказать о ?θ X X θP(Xθ)θXXθ

S-частота - это позиция, согласно которой не является случайной величиной; его истинные ценности в реальном мире - то, что они есть. Мы можем попытаться оценить их как некоторую , но мы не можем осмысленно говорить о вероятности нахождения в некотором интервале (например, быть положительным). Единственное, что мы можем сделать, - это разработать процедуру построения некоторого интервала вокруг нашей оценки, чтобы эта процедура успешно охватывала истинное значение с определенной частотой долгосрочного успеха (с определенной вероятностью).thetas ; & thetas ; & thetas ;θθ^θθ

Большая часть статистики, используемой сегодня в естественных науках, основана на этом подходе, поэтому сегодня наверняка есть много S-частых.

(Обновление: если вы ищете пример философа статистики, в отличие от практиков статистики, отстаивающих точку зрения S-частых, то прочитайте сочинения Деборы Майо; +1 к ответу @ NRH.)


ОБНОВЛЕНИЕ: О связи между P-частотой и S-частотой

@fcop и другие спрашивают о связи между P-частотой и S-частотой. Означает ли одна из этих позиций другую? Нет никаких сомнений в том, что исторически S-частота была разработана на основе позиции P-частоты; но они логически подразумевают друг друга?

Прежде чем подойти к этому вопросу, я должен сказать следующее. Когда я писал выше, что P-частых почти нет, я не имел в виду, что почти все являются P-субъективными-байесовскими-а-ля-де-финетти или P-propensitsist-a-la-popper. На самом деле, я полагаю, что большинство статистиков (или исследователей данных, или обучающихся машинам) - это «ничего-вообще» или «заткнись-и-вычисляй» (если позаимствовать знаменитую фразу Мермина ). Большинство людей склонны игнорировать проблемы с фундаментом. И это нормально. У нас нет хорошего определения свободной воли, или разума, или времени, или любви. Но это не должно мешать нам работать над нейробиологией, искусственным интеллектом, физикой или влюбляться.

Лично я не являюсь S-частотным, но ни у меня есть какое - либо последовательное представление о фундаменте вероятности.

Напротив, почти каждый, кто сделал некоторый практический статистический анализ, является или S-частым или S-байесовским (или возможно смесью). Лично я публиковал статьи, содержащие и никогда (до сих пор) не публиковал статьи, содержащие приоры и постеры по параметрам модели, так что это делает меня S-частым, по крайней мере на практике.p

Поэтому вполне возможно быть S-частым участником, не будучи P-частым участником, несмотря на то, что @fcop говорит в своем ответе.

Хорошо. Хорошо. Но все же: может ли P-байесовский быть S-частым? И может ли P-частик быть S-байесовским?

Для убежденного P-байесовца быть атипичным, вероятно, нетипичным, но в принципе вполне возможно. Например, P-байесовец может решить, что у него нет какой-либо предварительной информации в отношении и, следовательно, принять S-частый анализ. Почему нет. Каждое утверждение S-частоты, безусловно, может быть интерпретировано с помощью P-байесовской интерпретации вероятности.θ

Вероятно, проблематично для убежденного P-частого человека быть S-байесовским. Но тогда очень сложно быть убежденным P-частым ...


2
Комментарии не для расширенного обсуждения; этот разговор был перенесен в чат .
Glen_b

13

Работа Колмогорова «Основы теории вероятностей» имеет раздел «Связь с экспериментальными данными» на с.3. Вот что он написал там:

введите описание изображения здесь

введите описание изображения здесь

Он показывает, как можно вычесть его аксиомы, наблюдая за экспериментами. Это довольно частый способ интерпретации вероятностей.

У него есть еще одна интересная цитата о невозможных событиях (пустые наборы):

введите описание изображения здесь

Итак, я думаю, что если вы довольны этими аргументами, то вы должны признать, что вы частый человек. Этот ярлык не является эксклюзивным. Вы можете быть би-парадигмой (я придумал это слово), то есть и частым, и байесовским. Например, я становлюсь байесовским, когда применяю стохастические методы к явлениям, которые не являются стохастическими по своей природе.

ОБНОВЛЕНИЕ Как я писал ранее в CV, теория Колмогорова сама по себе не является частой. Это так же совместимо с байесовскими взглядами, как и с частыми взглядами. Он поместил эту симпатичную сноску в раздел, чтобы очень четко заявить, что он воздерживается от философии:

введите описание изображения здесь


1
ну, большинство аксиоматических систем получаются путем «абстрагирования» или «обобщения» концепций реального мира. То же самое относится к понятию (аксиомам) «метрики», они смотрели на концепцию реального мира (евклидово расстояние) и «нашли» три свойства, которые они использовали в качестве «аксиом» в метрическом пространстве. Но ваш ответ хороший (+1), он показывает, что Колмогоров не «изобрел» свои аксиомы «из воздуха», он разработал аксиоматическую систему, которая была связана с пониманием того, что в то время было пригодностью ,

1
Не могли бы вы взглянуть на комментарии @mpiktas к этому вопросу и сказать, что сам Колмогоров дал это определение? см. комментарии на stats.stackexchange.com/questions/230415/…

2
@fcop, я помню его ответ. Это казалось разумным. Определенно можно вывести аксиомы Байеса, и Колмогоров показывает это в книге.
Аксакал

1
+1 Именно то, что я имел в виду (в частности, сноску), когда писал комментарии к связанным темам. Также последний комментарий @Aksakal.
Грэм Уолш

1
@Aksakal: ссылаясь на ваш комментарий выше: это был не «его» ответ, а мой :-)

8

Я считаю, что уместно упомянуть Дебору Майо, которая пишет в блоге « Статистика ошибок философии» .

Я не буду утверждать, что у меня есть глубокое понимание ее философской позиции, но структура статистики ошибок , как описано в статье с Арисом Спаносом, действительно включает в себя то, что считается классическими статистическими методами. Цитировать статью:

Под эгидой статистических методов ошибок можно включить все стандартные методы, использующие вероятности ошибок, основанные на относительной частоте ошибок в повторной выборке, часто называемой теорией выборки или статистикой частых случаев .

И далее в той же статье вы можете прочитать, что:

Для ошибки статистики вероятность возникает не для измерения степени подтверждения или убеждения (фактического или рационального) в гипотезах, а для количественной оценки того, как часто методы способны различать альтернативные гипотезы и насколько надежно они способствуют обнаружению ошибки.


2
+1, Молодцы, упомянув блог Майо. Она действительно является самым громким философом статистики, который поддерживает статистику по частоте. В наши дни большинство других сует в Интернете поддерживают байесовскую статистику.
говорит амеба: восстанови Монику

6

nnAAAP(A)

P(A):=limn+nAn

Нетрудно видеть, что это определение удовлетворяет аксиомам Колмогорова (поскольку ограничение является линейным, см. Также. Есть ли какая-либо «математическая» основа для байесовских и частых дебатов? ).

Чтобы дать такое определение, они должны «верить», что этот предел существует. Так что частыми являются те, кто верит в существование этого предела.

РЕДАКТИРОВАТЬ от 31.08.2016: о разнице между S- и P-частотой

Поскольку в своем ответе @amoeba проводит различие между S-частыми и P-частыми лицами, где P-часто встречающиеся являются типом тех, кого я определяю выше, и поскольку он также утверждает, что быть P-частым трудно, я добавил раздел EDIT. утверждать, что верно обратное;

Я утверждаю, что все S-частые являются P-частыми .

В разделе S-частотности @amoeba говорит, что «эта процедура успешно охватывает истинную с определенной частотой долгосрочного успеха (с определенной вероятностью)».θ

В своем ответе он также заявляет, что P-частые люди - редкий вид.

Но эта «частота долгосрочного успеха», используемая для определения S-частотности, - это то, что он определяет как P-частоту, так как это интерпретация .P(CI^θ)

Поэтому, согласно его определениям, каждый S-частый участник также является P-частым участником. Поэтому я делаю вывод, что P-частые люди не так редки, как утверждают амебы.

Есть даже больше; @amoeba также утверждает, что S-частики считают неизвестный параметр фиксированным или неслучайным, поэтому нельзя говорить о «вероятности того, что имеет особое значение», он говорит, чтоθθθ

«Единственное, что мы можем сделать, - это разработать процедуру построения некоторого интервала вокруг нашей оценки таким образом, чтобы эта процедура успешно охватывала истинную с определенной частотой долгосрочного успеха (определенной вероятностью)».θ

Могу ли я спросить, каково может быть происхождение названия «частый»: (а) «неслучайная » -идея или (б) идея «долгосрочной частоты»?θ

Позвольте мне также спросить @mpiktas, который пишет в своем комментарии к ответу амебы:

«Быть ​​P-частым очень трудно, потому что практически невозможно дать математически обоснованное определение такой вероятности»

Если вам нужно определение P-частоты, чтобы определить S-частоту, как можно быть более S-частым, чем P-частиком?


3
@Tim: почему OLS будет «частым»?

2
Если это так, то обсуждение вопроса о том, кто является частым участником, похоже, не имеет особого смысла, поскольку сфера их интересов очень ограничена, а огромные области статистики выходят за их рамки ... (Включая множество областей, представляющих интерес для Bayesians.) то , что я хочу сказать, что это , кажется, не определение , так как оно является слишком узким.
Тим

2
Что делать Bayesians (самопровозглашенный, или просто прагматики , которые носят их «байесовскую шапку» для интерлюдии) верят ? limn+nAn
Серебряная

1
@Silverfish могут свободно использовать долгосрочные частоты в качестве вероятностей, если они хотят это делать, только частые пользователи не имеют выбора. Ключевым отличием является то, что может сказать, что , но в заключении нас интересует определение распределения по вероятным значениям , нами из наблюдений 1E12. p Hl i m n + n A / n p Hlimn+nA/npHlimn+nA/npH
Дикран Сумчатый

3
основание теории вероятностей именно по этой причине, т.е. дать определенные толкования вероятности математического обоснования. Теперь вы хотите вернуться и «заново изобрести» вероятность с помощью своего «частого» определения. Я нахожу это вводящим в заблуждение, поэтому я опущу ваши ответы. Вы можете игнорировать это, так работает сайт, всегда есть возможность для разногласий.
mpiktas

4

Действительно интересный вопрос!

Я бы поставил себя в лагерь частых рассуждений, когда дело доходит до понимания и интерпретации вероятностных утверждений, хотя я не так настойчиво отношусь к необходимости фактической последовательности экспериментов по iid для обоснования этой вероятности. Я подозреваю, что большинство людей, которые не покупают тезис о том, что «вероятность - это субъективная мера веры», также думают о вероятности таким образом.

Вот что я имею в виду: возьмите нашу обычную «честную» монету с заданием . Когда я слышу это, я формирую образ кого-то, бросающего эту монету много раз, и доля голов приближается к . Теперь, если нажать, я бы также сказал, что доля головок в любой случайной выборке из конечной последовательности таких подбрасываний монет также будет приближаться к при увеличении размера выборки (допущение независимости).0,5 0,5P(H)=0.50.50.5

Как было сказано другими, самым большим предположением является то, что этот предел существует и является правильным (т. Е. Предел равен ), но я думаю, что не менее важным является предположение о том, что такой же предел существует и для случайно выбранных подвыборок. В противном случае, наша интерпретация только имеет смысл WRT всю бесконечную последовательности (например, мы могли бы иметь сильные автокорреляции , который получает усредняется).0.5

Я думаю , что выше довольно спорное для frequentists. Байесовец будет больше сосредоточен на эксперименте, а не на поведении в долгосрочной перспективе: они заявят, что степень их уверенности в том, что следующим броском будет голова, равна ... полная остановка.P(H)=0.5

Для простого случая, такого как подбрасывание монеты, мы видим, что подходы, основанные на частоте и байесовском подходе, функционально эквивалентны, хотя и философски сильно различаются. Как указал Dikran Marsupial, байесовский эффект может фактически использовать тот факт, что эмпирически мы видим, что монеты поднимаются головами примерно так же часто, как мы видим, что они поднимаются хвостами (длительный период / большая частота выборки, как и ранее).

А как насчет вещей, которые не могут иметь долгосрочные частоты? Например, какова вероятность того, что Северная Корея начнет войну с Японией в ближайшие 10 лет? Для часто встречающихся мы действительно остаемся в беде, поскольку не можем описать распределение выборки, необходимое для проверки такой гипотезы. Байесовский сможет решить эту проблему, разместив распределение вероятностей по возможностям, скорее всего, на основе привлечения экспертной информации.

Однако возникает ключевой вопрос: откуда берутся эти степени убежденности (или предполагаемое значение для долгосрочной частоты)? Я бы поспорил с психологии и говорю , что эти убеждения (особенно в областях , далеких от экспериментальных данных) приходят от того , что называют наличие эвристическим и representativness эвристики . Есть множество других, которые, вероятно, вступают в игру. Я утверждаю это, потому что в отсутствие данных для калибровки наших убеждений (в направлении наблюдаемой долгосрочной частоты!) Мы должны полагаться на эвристику, какой бы сложной она ни казалась.

Вышеупомянутое ментальное эвристическое мышление в равной степени относится к частым и байесовским. Что меня интересует, так это то, что независимо от нашей философии, в корне мы больше верим в то, что, по нашему мнению, скорее всего будет правдой, и мы верим, что с большей вероятностью это будет правдой, потому что мы считаем, что есть больше способов для того, чтобы это было правдой, или мы представляем, что пути, ведущие к его истинности, будут происходить чаще (часто :-), чем те, которые делают это неправдой.

Поскольку это год выборов, давайте возьмем политический пример: какую веру мы бы выразили в высказывании «Тед Круз предложит запретить штурмовые винтовки в ближайшие 4 года». Теперь у нас есть некоторые данные об этом из его собственных заявлений, и мы, вероятно, поместили бы нашу предыдущую веру в истинность этого утверждения очень близко к нулю. Но почему? Почему его предыдущие высказывания заставляют нас так думать? Потому что мы думаем, что люди с высокой идеологией склонны «держаться за оружие» больше, чем их прагматичные коллеги. Откуда это? Вероятно, из исследований, проведенных психологами, и из нашего собственного опыта общения с принципиальными людьми.

Другими словами, у нас есть некоторые данные и уверенность в том, что в большинстве случаев, когда кто-то, как Круз, может изменить свое мнение, они этого не сделают (опять же, долгосрочная или большая выборочная оценка).

Вот почему я "совещаюсь" с частыми лицами. Это не моя неприязнь к байесовской философии (вполне разумной) или методам (они великолепны!), Но если я достаточно глубоко вникну в то, почему я придерживаюсь убеждений, которым не хватает сильной поддержки большого образца, я обнаружу, что полагаюсь на какую-то ментальной модели, где результаты могут быть подсчитаны (если неявно) или где я могу использовать долгосрочные вероятности в конкретном подпроцессе (например, республиканцы голосуют против мер контроля над оружием X% времени), чтобы так или иначе оценить мою веру ,

Конечно, это не совсем истинная частота, и я сомневаюсь, что есть много людей, которые согласны с интерпретацией вероятности буквы по Мизесу. Тем не менее, я думаю, что это показывает основную совместимость между байесовской и частотной вероятностью: оба апеллируют к нашей внутренней эвристике относительно доступности или к тому, что я называю «принципом Пачинко» о частотах вдоль цепочки причинно-следственных связей.

Поэтому, возможно, мне следует назвать себя «доступным», чтобы указать, что я назначаю вероятности на основе того, как часто я могу представить событие, происходящее как результат цепочки событий (с некоторой строгостью / моделированием, конечно). Если у меня много данных, отлично. Если я этого не сделаю, то я попытаюсь разложить гипотезу на цепочку событий и использовать имеющиеся у меня данные (анекдотичные или «здравый смысл», в зависимости от необходимости), чтобы оценить, как часто я представляю себе подобное событие.

Извините за длинный пост, отличный вопрос Кстати!


1
Вы делаете огромные упрощения относительно субъективистского подхода к вероятности. Я согласен с тем, что психология играет роль в том, как вы работаете с данными, но вы можете проводить субъективный анализ и в частом подходе. Некоторые байесовцы утверждают, что в байесовском случае, по крайней мере, вы выражаете свои субъективные убеждения, а не игнорируете их.
Тим

1
@ Я не говорил, что «Частые» более объективны (см. Мою первую часть об основных предположениях для часто встречающихся.) Кроме того, я указывал на то, что как частые, так и байесовские основатели обосновывают свои вероятности своими убеждениями о том, как часто что-то происходит или сколько вещей должно произойти (и их индивидуальная вероятность для этого), чтобы сделать что-то правдивым.

1
@ Тим, так как это не Пост о Байесианизме против Частотизма как такового, я сомневаюсь, что я отдал им должное ... это заняло бы много места на странице! По сути, мы все полагаемся на ментальную эвристику, когда думаем о вероятности, и эта эвристика заставляет нас задуматься о том, что некоторые типы событий могут произойти «несколькими способами» или «более доступны в причинно-следственной сети», чем другие.

1
@ Хорошо ... Я добавил несколько языков, чтобы прояснить, когда я перехожу от моего (краткого) обсуждения байесовства к моей основной деятельности.

4

Как заметил @amoeba , у нас есть частые определения вероятности и частые статистики . Все источники, которые я видел до сих пор, говорят о том, что частые умозаключения основаны на частичном определении вероятности, то есть понимании его как предела в пропорции при бесконечном числе случайных ничьих (как уже заметили @fcop и @Aksakal со ссылкой на Колмогорова)

P(A)=limnnAn

Таким образом, в основном, существует понятие некоторой популяции, из которой мы можем повторить выборку. Эта же идея используется в частых умозаключениях. Я просмотрел несколько классических работ, например, Ежи Неймана , чтобы отследить теоретические основы статистической статистики. В 1937 году Нейман написал

( ia ) Статистик занимается популяцией , которая по тем или иным причинам не может быть изучена исчерпывающе. Из этой совокупности можно извлечь только выборку, которая может быть детально изучена и использована для формирования мнения о значениях определенных констант, описывающих свойства совокупности . Например, может потребоваться приблизительно рассчитать среднее значение определенного характера, которым обладают лица, составляющие население и т. Д. ( Ibπ π ππππ
В качестве альтернативы, статистик может быть заинтересован в определенных экспериментах, которые, если они повторяются в явно идентичных условиях, дают разные результаты. Такие эксперименты называются случайными [...] экспериментами.
В обоих описанных случаях проблема, с которой сталкивается статистика, - это проблема оценки. Эта проблема состоит в определении того, какие арифметические операции следует выполнить с данными наблюдений, чтобы получить результат, который должен называться оценкой, которая, по-видимому, не сильно отличается от истинного значения числового символа, либо от совокупности как в ( ia ) или случайных экспериментов, как в ( ib ). [...] В ( И.А.π
) мы говорим о статистике, рисующем выборку из изученной популяции.

В другой статье (Neyman, 1977) он отмечает, что доказательства, представленные в данных, должны быть проверены путем наблюдения повторяющейся природы изучаемого явления:

Обычно «проверка» или «проверка» предполагаемой модели состоит в том, чтобы вывести некоторые из ее частых последствий в ситуациях, которые ранее не изучались эмпирически, а затем в проведении соответствующих экспериментов, чтобы увидеть, соответствуют ли их результаты предсказаниям. В целом, первая попытка проверки отрицательна: наблюдаемые частоты различных результатов эксперимента не согласуются с моделью. Однако в некоторых счастливых случаях существует разумное согласие, и каждый чувствует, что удовлетворен тем, что «понял» явление, по крайней мере, в некотором общем смысле. Позже неизменно появляются новые эмпирические данные, указывающие на неадекватность исходной модели и требующие ее отказа или модификации. И это история науки!

и в еще одной статье Нейман и Пирсон (1933) пишут о случайных выборках, взятых из фиксированной популяции

В обычной статистической практике, когда наблюдаемые факты описываются как «выборки», а гипотезы касаются «популяций», для которых были взяты выборки, их характеристик или, как мы их называем, критериев, которые были используется для проверки гипотез, часто кажется, что их фиксирует счастливая интуиция.

Статистические данные в этом контексте формализуют научные рассуждения о том, где собираются доказательства, затем берутся новые образцы для проверки первоначальных результатов, и по мере накопления новых данных кристаллизуется наше состояние знаний. Опять же, как описано Нейманом (1977), процесс предпринимает следующие шаги

( i ) Эмпирическое установление, по-видимому, стабильных долгосрочных относительных частот (или «частот» для краткости) событий, которые были сочтены интересными по мере их развития в природе.
( ii ) угадывание, а затем проверка «случайного механизма», повторяющееся действие которого производит наблюдаемые частоты. Это проблема «частой теории вероятностей». Иногда этот шаг называется «построение модели». Естественно, предполагаемый случайный механизм является гипотетическим.
( iii ) Использование механизма гипотетической случайности изучаемого явления, чтобы вывести правила приспособления наших действий (или «решений») к наблюдениям, чтобы обеспечить высшую «меру» «успеха». [... «правил корректировки наших действий» - это проблема математики, в частности математической статистики.

Частые люди планируют свои исследования, имея в виду случайный характер данных и идею повторных отборов из фиксированной популяции, они разрабатывают свои методы на основе этого и используют его для проверки своих результатов (Neyman and Pearson, 1933),

Не надеясь узнать, является ли каждая отдельная гипотеза истинной или ложной, мы можем искать правила, управляющие нашим поведением по отношению к ним, следуя которым мы заверяем, что в долгом опыте мы не будем слишком часто ошибаться.

Это связано с принципом повторной выборки (Cox and Hinkley, 1974):

(ii) Принцип
строгой повторной выборки Согласно принципу строгой повторной выборки, статистические процедуры должны оцениваться по их поведению в гипотетических повторениях при одинаковых условиях. Это имеет две стороны. Меры неопределенности следует интерпретировать как гипотетические частоты в длительных повторениях; Критерии оптимальности должны быть сформулированы с точки зрения чувствительного поведения в гипотетических повторениях.
Аргументом для этого является то, что он обеспечивает физический смысл для вычисляемых нами величин и обеспечивает тесную связь между анализом, который мы проводим, и базовой моделью, которая рассматривается как представляющая «истинное» состояние дел.

(iii) Слабый принцип повторной выборки
. Слабая версия принципа повторной выборки требует, чтобы мы не следовали процедурам, которые для некоторых возможных значений параметров в большинстве случаев приводили бы к ошибочным выводам, вводящим в заблуждение.

В отличие от этого, при использовании максимальной вероятности мы имеем дело с имеющейся у нас выборкой , а в байесовском случае мы делаем вывод на основе выборки и наших априоров, и, когда появляются новые данные, мы можем выполнять байесовское обновление. В обоих случаях идея повторной выборки не является решающей. Частые пользователи полагаются только на данные, которые у них есть (как заметил @WBT ), но имейте в виду, что это нечто случайное и это следует рассматривать как часть процесса повторной выборки из населения (вспомните, например, насколько достоверно интервалы определены).

В частом случае идея повторной выборки позволяет нам количественно оценить неопределенность (в статистике) и позволяет интерпретировать реальные события с точки зрения вероятности .


В качестве примечания отметим, что ни Нейман (Lehmann, 1988), ни Пирсон (Mayo, 1992) не были настолько частыми, насколько мы могли себе представить. Например, Нейман (1977) предлагает использовать эмпирические байесовские и максимальные правдоподобия для точечной оценки. С другой стороны (Mayo, 1992),

в ответе Пирсона (1955) на Фишера (и в других местах его работы) говорится, что Пирсон отвергает обоснование низкой долгосрочной вероятности ошибки в научных исследованиях [...]

Таким образом, кажется, что трудно найти чистых частых людей даже среди отцов-основателей.


Нейман Дж. И Пирсон Э.С. (1933). К вопросу о наиболее эффективных проверках статистических гипотез. Философские труды Королевского общества A: Математические, физические и инженерные науки. 231 (694–706): 289–337.

Нейман, J. (1937). Изложение теории статистической оценки на основе классической теории вероятностей. Фил. Сделка R. Soc. Лонд. А. 236: 333–380.

Нейман, J. (1977). Частые вероятности и частые статистики. Synthese, 36 (1), 97-131.

Майо, Д. Г. (1992). Пирсон отверг философию статистики Неймана-Пирсона? Synthese, 90 (2), 233-262.

Кокс, Д.Р. и Хинкли, Д.В. (1974). Теоретическая статистика. Чепмен и Холл.

Lehmann, E. (1988). Ежи Нейман, 1894-1981 гг. Технический отчет № 155. Статистический факультет Университета Калифорнии.


1
+1 (уже несколько дней назад). Спасибо, что написали это, здесь есть несколько хороших цитат, и список литературы очень полезен. В свою очередь, я обновил свой ответ в нескольких местах, но в основном в конце, чтобы прояснить связь между P- и S-частотой, как я ее вижу. Я, конечно, согласен с тем, что исторически S-freq был построен на идеях P-freq, как вы здесь утверждаете, но я не думаю, что они обязательно связаны друг с другом.
говорит амеба, восстанови Монику

4

Позвольте мне предложить ответ, который связывает этот вопрос с актуальным и очень практическим вопросом - точную медицину, и в то же время отвечаю на него буквально так, как его спросили: кто такие частые люди?

Частые люди - это люди, которые говорят такие вещи, как [1] ​​(выделено мной):

Что означает 10% риск события в течение следующего десятилетия для человека, для которого оно было сгенерировано? Вопреки тому, что думают, этот уровень риска не является личным риском этого человека, потому что вероятность не имеет смысла в отдельном контексте .

Таким образом, частые специалисты интерпретируют «вероятность» таким образом, что она не имеет значения в единственном контексте, как у отдельного пациента . В моем комментарии PubMed Commons к [1] ​​исследуются искажения, которым должны подвергаться авторы, которые часто посещают его, чтобы восстановить подобие вероятностного понятия, применимого к уходу за отдельным пациентом. Наблюдение за тем, как и почему они это делают, может оказаться очень поучительным в отношении того, кто является частым участником . Кроме того, в значительной степени не освещающий последующий обмен в разделе « Письма JAMA » [2,3] поучителен как важность явного признания ограничений в частых представлениях о вероятности и прямой атаки на них.в качестве таких. (Я сожалею, что многие пользователи резюме могут обнаружить, что [1] находится за платным доступом.)

Отличная и легко читаемая книга [4] Л. Джонатана Коэна окупит усилия всех, кто интересуется вопросом ОП. Примечательно, что книга Коэна, как ни странно, цитировалась [1] в связи с утверждением «вероятность не имеет смысла в отдельном контексте», хотя Коэн явно упрекает эту точку зрения следующим образом [4, с49]:

Теоретик частоты также не может утверждать, что все важные вероятности действительно являются общими, а не единичными. Часто кажется очень важным иметь возможность рассчитать вероятность успеха для аппендэктомии вашего ребенка ...


1] Sniderman AD, D'Agostino Sr RB и Pencina MJ. «Роль врачей в эпоху прогнозной аналитики». JAMA 314, no. 1 (7 июля 2015 г.): 25–26. DOI: 10,1001 / jama.2015.6177. PubMed

2] Ван Калстер Б., Штейерберг Э.В. и Харрелл Ф.Х. «Прогноз риска для частных лиц». JAMA 314, no. 17 (3 ноября 2015 г.): 1875–1875. DOI: 10,1001 / jama.2015.12215. Полный текст

3] Sniderman AD, D'Agostino Sr RB и Pencina MJ. «Предсказание риска для отдельных лиц - ответ». JAMA 314, no. 17 (3 ноября 2015 г.): 1875–76. DOI: 10,1001 / jama.2015.12221. Полный текст

4] Коэн, Л. Джонатан. Введение в философию индукции и вероятности. Оксфорд: Нью-Йорк: Кларендон Пресс; Издательство Оксфордского университета, 1989. Ссылка на отсканированные страницы 46-53 и 81-83


1
2] доступно в Интернете: lirias.kuleuven.be/bitstream/123456789/513795/1/…
Тим

Мне нравится цитата «риск можно рассматривать как субъективный уровень, на который человек« верит »или« готов делать ставку »на возникновение заболевания или события 2, точно так же, как ставку на будущие одноразовые события в спортивных играх ". Спасибо за ваш вклад и ссылки.
Тим

2
Выглядит как хороший ответ, но я немного растерялся. Я полагаю, что часто исследователи занимаются процедурами (экспериментами), которые теоретически могут проводиться бесконечное число раз. Это не значит, что они не могут предсказать следующий бросок монеты, просто то, что их проблемы / гарантии концентрируются на процессе. Правда, они сказали бы, что «США выиграют чемпионат мира в этом году» - это не то, о чем они могли бы сказать, но они не могли бы что-то сказать об аппендэктомии вашего ребенка - это уникально в определенном смысле, но аппендэктомии на детей нет.
Уэйн

@Tim, спасибо за ссылку, которая включает в себя [2] и [3]. Я обновил текст моего ответа соответственно.
Дэвид С. Норрис

2
@Wayne, я хотел бы предложить, чтобы ответ амебы выше - с его различием между статистическими процедурами, обычно связанными с «частотным представлением вероятности» и самим частотным представлением - отвечает на ваш комментарий. Люди могут использовать частые статистические процедуры, но при этом интерпретировать и использовать полученные вероятности в фидуциальных или субъективистских методах. Достаточно взглянуть на постоянную ошибку интерпретации P-значений как «вероятность того, что нулевая гипотеза верна», чтобы увидеть, что это так.
Дэвид С. Норрис

3

«Частые против байесов » из XKCD (под CC-BY-NC 2.5 ), нажмите, чтобы обсудить:

«Детектор!  Что бы сказал байесовский статистик, если бы я спросил его, является ли… [roll] Я НЕЙТРИНО-ДЕТЕКТОРОМ, а не ЛАБИРИНТОВЫМ ОХРАНОМ.  СЕРЬЕЗНО, УЖЕ ВЫШЕЛ МОЗГ?  [roll] '... да.'

Общая точка зрения на философию частоты, проиллюстрированную здесь, - это вера в то, что можно сделать выводы об относительной вероятности событий, основанной исключительно («чисто») на наблюдаемых данных, без «загрязнения» этого процесса оценки предвзятыми представлениями о том, как вещи должны или не должно быть. При представлении оценки вероятности частый участник не принимает во внимание предшествующее мнение о вероятности события, когда имеются наблюдения, доступные для подтверждения его эмпирической вероятности. Частый участник должен учитывать эту справочную информацию при принятии решения о пороге для действия или заключения.

Как писал Дикран Марсупиал в кратком комментарии ниже : «Ценный момент, который карикатура (возможно, непреднамеренно) делает, заключается в том, что наука действительно более сложна, и мы не можем просто применить« нулевой ритуал », не думая о предшествующих знаниях».

В качестве другого примера, при попытке определить / объявить, какие темы являются «трендовыми» на Facebook, часто пользователи будут приветствовать более чисто алгоритмический подход к подсчету, к которому смещается Facebook , а не старую модель, в которой сотрудники курируют этот список, частично основываясь на их собственные исходные точки зрения о том, какие темы, по их мнению, «должны» быть наиболее важными.


10
-1. Я люблю XKCD, но без каких-либо комментариев, я боюсь, что это только вводит в заблуждение в этой теме. И нужно немного комментариев, чтобы правильно объяснить, какие проблемы связаны с этим комиксом. Если вы предоставите соответствующую дискуссию, я уберу понижение.
говорит амеба, восстанови Монику

4
Неверно, что у подхода, основанного на частоте, нет предвзятых понятий, они закодированы в пределе статистической значимости. В ISTR есть хорошая цитата Фишера об этом в зависимости от характера эксперимента. Это полностью проблема с частыми персонажами в мультфильме, они просто не установили подходящее значение для как они не приняли во внимание «предварительные знания» о проблеме (что маловероятно, что восходящая Солнце) и скорректировал тест соответственно. Использование 95% все время является частью критикуемого «нулевого ритуала». α
Дикран Сумчатый

4
«Нулевой ритуал» - это плохое применение статистик, но это не проблема фрикентизма как таковой.
Дикран Сумчатый

2
@Dikran Ваши комментарии, кажется (неправильно) приравнивают "Frequentist" к "пользователю NHSTs". Это та путаница, о которой я беспокоюсь.
whuber

3
@luchonacho FWIW здесь обсуждается карикатура XKCD stats.stackexchange.com/questions/43339/… Ценный момент, который делает мультфильм (возможно, непреднамеренно), заключается в том, что наука действительно более сложна, и мы не можем просто применить «ноль». ритуал "не думая о предварительных знаниях.
Дикран Сумчатый

3

(Замечание, только косвенно релевантное для вопроса и сайта.)

Вероятность заключается в объективном статусе отдельных вещей . Вещи не могут иметь намерения, и они получают свои статусы от вселенной. С какой-то вещью всегда должно происходить событие (придающее ему статус): событие уже там завершено, даже если оно еще не произошло - прошлое вещи, также называемое «судьбой» или случайностью.

Опять же , с вероятностью, то факт события - того же произошло или нет, не имеет значения , - это уже есть [в отличие от смысла нет , который никогда в этой стране]; и как таковой он уже стал ненужным и лишним. Этот факт следует отбросить, и его недействительность - это то, что мы называем «событие вероятное». Любой факт о вещи несет в себе ее первозданную неубедительной сторону, или вероятность того , (даже на самом деле произошли фактически - мы признаем это на уколе неверия). Мы неизбежно «устали от вещей» до психического до некоторой степени. Поэтому остается только количественно оценить это частичное отрицание фактичности, если нужно число. Один из способов количественной оценки состоит в том, чтобы считать, Еще стоит взвесить . Частик выполняет или воображает серию испытаний, лежащих перед ним, которые он поворачивает лицом к лицу, чтобы увидеть, действительно ли событие происходит; он считает. Байесовец рассматривает серию психологических мотивов, тянущих его за собой, которые он экранирует; он взвешивает их как вещи. Оба мужчины заняты обвинением / оправданием игры ума. По сути, между ними нет большой разницы.

Возможность о возможностях меня в мире. Возможность всегда моя (шанс дождя - моя проблема - взять зонтик или промокнуть) и касается не объекта (тот, который я считаю возможным или имеющим возможность), а всего мира для меня. Возможность всегда 50/50, и она всегда убедительна, потому что она подразумевает - либо требует до, либо влечет за собой - мое решение, как себя вести. Сами вещи не имеют намерений и, следовательно, возможностей. Мы не должны путать наши возможности этих вещей для нас с их собственными вероятностями "стохастического детерминизма". Вероятность никогда не может быть «субъективной» в человеческом смысле.


Наблюдающий читатель может почувствовать в ответ замаскированный раскоп при ярком ответе в этой теме, где @amoeba говорит, что он думает "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Можно было бы сделать наоборот: байесовские определители вероятности не существуют как разные классы. Потому что, как я признал, байесовцы воспринимают изменения реальности так же, как и частые участники - как ряд фактов; только эти факты не эксперименты, скорее воспоминания о «истинах» и «аргументах». Но такие формы знания основаны на фактах и ​​могут быть подсчитаны или взвешены. Вероятность его возведения не синтезируется как субъективная, то есть упреждающая («байесовская»), если только человек не ожидает(возможность) выходит на сцену, чтобы вмешиваться. И @amoeba с тревогой впускает это, когда воображает, что «монета исчезнет, ​​а Солнце станет сверхновой».


0

О, я был частым участником в течение многих лет,
и я потратил все свое время на проигрывание данных на слух,
но теперь я возвращаюсь с Байесом в отличном магазине,
и я больше никогда не буду играть на частоте.

Ибо нет, нет, никогда, нет, нет, никогда, не более,
Буду ли я играть часто, нет, никогда, не более!

Я пошел в лабораторию, где я имел обыкновение консультироваться.
Они дали мне некоторые данные, сказали «p, что для нас»,
я сказал: «Нет, Хосе», с легкой улыбкой,
значения P и очевидность просто не согласовываются!

хор

Я сказал, что ваш предшественник должен пролить свет,
и глаза исследователя широко раскрылись от восторга.
Он сказал: «Мои прежние взгляды так же хороши, как и все остальные,
и наверняка Байесовский фактор - это то, что будет работать лучше всего!»

хор

Я вернусь к своим учителям, признаюсь в том, что я сделал,
и попрошу их помиловать своего блудного сына.
Но когда они простят меня, как часто раньше,
я больше никогда не буду играть в частик!

хор

И нет, нет, никогда, нет, нет, никогда, больше не
буду , буду ли я играть часто, нет, никогда, не больше!

Источник: AE Raftery, в Bayesian Songbook, под редакцией BP Carlin, по адресу http://www.biostat.umn.edu/ . Поет в традиционной народной мелодии «Дикий Ровер». Цитируется в открытом университете M347 Математическая статистика, Раздел 9.


2
Это должно быть довольно опубликовано здесь: stats.stackexchange.com/questions/1337/statistics-jokes
Тим

Согласитесь с @Tim и -1, потому что я не вижу, как это добавляет к настоящему обсуждению.
говорит амеба, восстановите Монику
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.