Камминг (2008) утверждает, что распределение значений p, полученных в репликациях, зависит только от исходного значения p. Как это может быть правдой?


52

Я читал 2008 документ Джеффа Камминг репликации и Интервалы: значения предсказывать будущее лишь смутно, но доверительные интервалы делают намного лучше pp р р[~ 200 ссылок в Google Scholar] - и смущает одно из центральных требований. Это одна из серии статей, где Камминг спорит с и поддерживает доверительные интервалы; Мой вопрос, однако, не об этой дискуссии, а касается только одного конкретного утверждения о .pp

Позвольте мне процитировать из резюме:

В этой статье показано, что если в результате первоначального эксперимента двухстороннее , вероятность того, что одностороннее значение в репликации упадет в интервале , составляет , вероятность того, что , и полностью вероятность того, что . Примечательно, что интервал, называемый интервалом настолько широк, насколько велик размер выборки.p=.0580%p(.00008,.44)10%p<.0000810%p>.44p

Камминг утверждает, что этот « интервал» и фактически все распределение значений, которые можно получить при репликации исходного эксперимента (с тем же фиксированным размером выборки), зависят только от исходного -значения и не зависит от истинного размера эффекта, мощности, размера выборки или чего-либо еще:pp p o b tpppobt

[...] распределение вероятности может быть получено без знания или принятия значения для (или степени). [...] Мы не предполагаем каких-либо предварительных знаний о , и мы используем только информацию, которую [наблюдаемая разница между группами] дает о в качестве основы для вычисления для данного распределения и интервалов.pδδMdiffδpobtpp

Камминг 2008

Меня это смущает, потому что мне кажется, что распределение значений сильно зависит от мощности, тогда как сам по себе исходный не дает никакой информации об этом. Может случиться так, что истинный размер эффекта будет и тогда распределение будет равномерным; или, может быть, истинный размер эффекта огромен, и тогда нам следует ожидать в основном очень маленьких значений. Конечно, можно начать с допущения о некотором априорном возможном размере эффекта и интегрировать его, но Камминг, похоже, утверждает, что это не то, что он делает.p o b t δ = 0 pppobtδ=0p

Вопрос: что именно здесь происходит?


Обратите внимание, что эта тема связана с этим вопросом: какая доля повторных экспериментов будет иметь величину эффекта в пределах 95% доверительного интервала первого эксперимента? с отличным ответом @whuber. У Камминга есть статья на эту тему: Камминг и Мейлардет, 2006, Доверительные интервалы и тиражирование: куда пойдет следующий смысл? - но это ясно и беспроблемно.

Я также отмечаю, что утверждение Камминга повторяется несколько раз в статье 2015 года Nature Methods . Непостоянное значение приводит к невоспроизводимым результатам, сP которыми некоторые из вас могли столкнуться (у него уже есть ~ 100 ссылок в Google Scholar):

[...] будет существенное изменение в значении повторных экспериментов. На самом деле эксперименты редко повторяются; мы не знаем , как отличаются следующим может быть. Но вполне вероятно, что это может быть совсем по-другому. Например, независимо от статистической мощности эксперимента, если один Репликация возвращает значения , есть вероятность того, что повторный эксперимент будет возвращать значения в диапазоне от и (и изменений [так] что будет еще больше).P P 0,05 80 % P 0 0,44 20 % PPPP0.0580%P00.4420%P

(Заметьте, кстати, как, независимо от того, является ли утверждение Камминга правильным или нет, газета Nature Methods цитирует его неточно: согласно Каммингу, вероятность составляет всего выше . И да, газета говорит «20% чан» г е ". Пффф.)0,4410%0.44


8
Разве любое подобное утверждение не должно зависеть от предполагаемого естественного состояния - и не будет ли это по умолчанию нулевой гипотезой? Для простых нулевых гипотез и непрерывно распределенной статистики значение p имеет равномерное распределение. Все вытекает из этого факта.
whuber

4
@whuber Хорошо, дистрибутивы, показанные на рисунке 5, которые я воспроизвел здесь, явно не одинаковы. Я согласен, хотя, что любое такое распределение, казалось бы, должно быть обусловлено естественным состоянием, но Камминг, кажется, утверждает обратное. Отсюда мой вопрос: что на самом деле происходит в этой статье? Я неправильно понимаю претензию? Бумага просто не права? Можем ли мы выяснить некоторые скрытые предположения? И т.д.
амеба говорит восстановить Монику

Примечание для себя: этот arxiv.org/abs/1609.01664, по-видимому, связан, но быстрый взгляд не решил мою загадку.
говорит амеба: восстанови Монику

1
Хотелось бы, чтобы я не давал финалы на этой неделе, или я бы потратил на это некоторое время. Не имеет смысла, что последующее значение p должно зависеть от мощности, при условии, что оба размера выборок одинаковы. Наблюдаемое значение p должно зависеть только от истинного значения параметра и выбранного вами значения null. Полезность оценки зависит от мощности, но это не вопрос здесь.
Дейв Харрис

3
Я вышел из своей лиги здесь ... но просматривая статью, кажется, что все находится в контексте проверки на значительную разницу в средних двух гауссовых популяций с одинаковой известной дисперсией и размерами выборки, с нулевым 0 . Это верно? (т.е. где под нулем.) Или бумага имеет более широкий охват, так как вопрос / комментарии здесь, кажется, указывают? г=Дцz=Δx¯σN2Nz,1z=ΔμσN2=0
GeoMatt22

Ответы:


21

Резюме: уловка, кажется, является байесовским подходом, который предполагает униформу ( Джеффриса ) перед скрытым параметром ( в приложении B к статье, здесь). θzμθ

Я полагаю, что может быть подход в байесовском стиле, чтобы получить уравнения, приведенные в приложении B.

Насколько я понимаю, эксперимент сводится к статистике . Среднее значение распределения выборки неизвестно, но исчезает при нулевой гипотезе . θ θ zNθ,1θθH0=0

Назовите наблюдаемую в эксперименте статистику . Тогда, если мы примем «равномерный» ( несобственный ) до , байесовский апостериор будет . Если затем мы обновим исходное распределение выборки путем маргинализации по , апостериор станет . (Удвоенная дисперсия обусловлена ​​сверткой гауссианов.)z^θNθ,1θ1θz^Nz^,1θz^zz^Nz^,2

По крайней мере, математически это работает. И это объясняет, как фактор «магическим образом» переходит от уравнения B2 к уравнению B3.12


обсуждение

Как этот результат может быть согласован со стандартной структурой тестирования нулевой гипотезы? Одна из возможных интерпретаций заключается в следующем.

В стандартной структуре нулевая гипотеза в некотором смысле является «значением по умолчанию» (например, мы говорим о «отклонении нулевого значения»). В приведенном выше байесовском контексте это будет неоднородный априор, который предпочитает . Если мы примем это как , то дисперсия представляет нашу предыдущую неопределенность.θ=0θN0,λ2λ2

Выполнение этого до анализа, приведенного выше, приводит к Отсюда видно, что в пределе восстанавливаем анализ выше. Но в пределе наши "постеры" становятся нулевыми, и , поэтому мы возвращаем стандартный результат: .

θN0,λ2θz^Nδ2z^,δ2,zz^Nδ2z^,1+δ2,δ211+λ2[0,1]
λλ0θz^N0,0zz^N0,1pz^U0,1

(Для повторных исследований вышеизложенное наводит на интересный вопрос о последствиях байесовского обновления по сравнению с «традиционными» методами метаанализа. Хотя я совершенно не осведомлен о предмете метаанализа!)


аппендикс

Как и просили в комментариях, вот график для сравнения. Это относительно простое применение формул в статье. Однако я напишу это, чтобы не допустить двусмысленности.

Обозначим через одностороннее значение p для статистики и обозначим его (задний) CDF через . Тогда уравнение B3 из приложения эквивалентно где - стандартный нормальный CDF. Тогда соответствующая плотность будет где - стандартный нормальный PDF, а как в формула CDF. Наконец, если мы обозначим наблюдаемоеz F [ u ] Pr [pzF[u]Pr[puz^]Φ [

F[p]=1Φ[12(z[p]z^)],z[p]=Φ1[1p]
Е [ р ]F ' [ р ] = φ [ ( г - г ) / Φ[] ϕ[
f[p]F[p]=ϕ[(zz^)/2]2ϕ[z]
Г = г [ р ] р г г = Φ - 1 [ 1 - рϕ[]z=z[p]p^двухстороннее значение p, соответствующее , тогда имеем z^
z^=Φ1[1p^2]

Использование этих уравнений дает приведенный ниже рисунок, который должен быть сопоставим с рисунком 5, приведенным в вопросе. «Воспроизведение» Cumming (2008) Рис. 5 через опубликованные формулы.

(Это было сделано с помощью следующего кода Matlab; запустите здесь .)

phat2=[1e-3,1e-2,5e-2,0.2]'; zhat=norminv(1-phat2/2);
np=1e3+1; p1=(1:np)/(np+1); z=norminv(1-p1);
p1pdf=normpdf((z-zhat)/sqrt(2))./(sqrt(2)*normpdf(z));
plot(p1,p1pdf,'LineWidth',1); axis([0,1,0,6]);
xlabel('p'); ylabel('PDF p|p_{obs}');
legend(arrayfun(@(p)sprintf('p_{obs} = %g',p),phat2,'uni',0));

1
Я надеюсь, что, обнажив основополагающее предположение (например, единообразный априор скрытого параметра), теперь обсуждение может сосредоточиться на научном / статистическом вопросе, который, как я считаю, был вашей целью! (Вместо вопроса математики / вероятности, на который я ответил выше.)
GeoMatt22

Я нашел несколько старых и не очень старых дискуссий на эту тему: Goodman 1992 , комментарий к Goodman от Senn 2002 и недавний Lazzeroni et al 2014 . Последнее кажется довольно бесполезным (но я упоминаю это для полноты), но первые два, особенно комментарий Сенна, кажутся очень уместными.
говорит амеба: восстанови монику

амеба спасибо что выкопали эти ссылки, они выглядят интересно! Для полноты я добавил раздел «обсуждение», пытаясь связать результат Cumming и стандартную структуру.
GeoMatt22

Обновление: я прочитал статьи Гудмена и Сенна, на которые ссылались выше, и теперь опубликовал свой собственный ответ, чтобы подвести итог моей нынешней интуиции. (Кстати, я был рад принять ваш ответ и наградить его за вознаграждение. Еще раз спасибо.)
говорит амеба Восстановить Монику

27

Спасибо за все интересные обсуждения! При написании этой статьи 2008 года мне потребовалось некоторое время, чтобы убедить себя в том, что распределение репликации p ( значение p, заданное точной репликацией исследования, то есть исследование, которое точно такое же, но с новым образцом), зависит только по п приведенному оригинальному исследованию. (В статье я предполагаю нормально распределенную популяцию и случайную выборку, и что наши исследования направлены на оценку среднего значения популяции.) Следовательно, интервал p (интервал прогнозирования 80% для репликации p ) одинаков, независимо от N , сила, или истинный размер эффекта оригинального исследования.

Конечно, это сначала невероятно. Но обратите внимание, что мое первоначальное утверждение основано на знании p из исходного исследования. Подумай об этом так. Предположим, вы сказали мне, что ваше первоначальное исследование нашло р = 0,05. Вы не говорите мне больше ничего об исследовании. Я знаю, что 95% -й доверительный интервал в вашем среднем значении простирается точно до нуля (при условии, что p было рассчитано для нулевой гипотезы нуля). Таким образом, ваше среднее значение выборки - МО (длина одного плеча этого 95% ДИ), потому что это расстояние от нуля. Распределение выборки средств из таких исследований, как ваше, имеет стандартное отклонение MoE / 1,96. Это стандартная ошибка.

Рассмотрим среднее значение, данное точной репликацией. Распределение этого среднего значения репликации имеет среднее значение MoE, то есть это распределение центрировано на вашем исходном среднем значении. Рассмотрите разницу между вашим средним значением выборки и средним значением репликации. Он имеет дисперсию, равную сумме отклонений от среднего значения исследований, таких как ваше оригинальное исследование, и повторений. Это вдвое больше, чем у оригинального исследования, т.е. 2 x SE ^ 2. Что в 2 раза (МО / 1,96) ^ 2. Таким образом, SD этой разницы составляет SQRT (2) x МО / 1,96.

Поэтому мы знаем распределение среднего значения репликации: его среднее значение равно МО, а SD - SQRT (2) x МО / 1,96. Конечно, горизонтальный масштаб является произвольным, но нам нужно знать это распределение только по отношению к КИ из вашего первоначального исследования. Когда выполняются репликации, большинство средств (около 83%) упадут в этом исходном 95% -ном доверительном интервале, и около 8% упадут ниже его (т. Е. Ниже нуля, если исходное среднее значение было> 0) и на 8% выше, чем это. CI. Если мы знаем, где среднее значение репликации находится относительно вашего исходного CI, мы можем вычислить его значение p . Мы знаем распределение таких средств репликации (по отношению к вашему CI), поэтому мы можем выяснить распределение репликации pстоимость. Единственное предположение, которое мы делаем в отношении репликации, состоит в том, что она является точной, то есть она была из той же группы населения, с тем же размером эффекта, что и в вашем первоначальном исследовании, и что N (и схема эксперимента) были такими же, как в вашем исследовании. ,

Все вышесказанное является лишь повторением аргумента в статье, без рисунков.

Тем не менее, неофициально, может быть полезно подумать, что подразумевает p = .05 в оригинальном исследовании. Это может означать, что у вас огромное исследование с крошечным размером эффекта или крошечное исследование с гигантским размером эффекта. В любом случае, если вы повторите это исследование (тот же N , то же население), вы, несомненно, получите несколько иное среднее значение выборки. Оказывается, что с точки зрения значения p «несколько другое» одинаково, независимо от того, было ли у вас огромное или крошечное исследование. Итак, скажите мне только ваше значение р, и я скажу вам ваш интервал р .

Geoff


8
Большое спасибо за регистрацию на этом сайте, чтобы ответить на мой вопрос! Я это очень ценю. Я до сих пор не уверен, но у меня будет время подумать над вашим ответом. Мое нынешнее чувство состоит в том, что вы делаете правильное замечание, но я не согласен с тем, как вы сформулируете это. Одно простое возражение: р = 0,05 согласуется с истинностью Н0. Если H0 истинно, р будет в диапазоне 0,04-0,05 1% времени. Если это так, то распределение значений р репликации будет равномерным от 0 до 1. Но при любых обстоятельствах вы прогнозируете другое распределение для начального p = 0,05 . Как следует думать об этом?
говорит амеба: восстанови Монику

7
Неявное предположение в этом аргументе выглядит несостоятельным: дело в том, что «точная репликация» имеет среднее значение, равное МО. Если под «точной репликацией» мы подразумеваем повторение эксперимента с тем же естественным состоянием, то распределение тестовой статистики неизвестно: оно зависит от естественного состояния. Помимо принятия байесовской точки зрения - что означает, что вам нужно явно заявить о своем предшествующем - единственный способ добиться прогресса - это вычислить вероятности до того, как будет выполнен оригинал или реплика, не зависящая от реплики.
whuber

2
@ user43849 Я бы со всем уважением утверждал, что такой человек не понимает, что такое p-значение. Значение p мало или ничего не говорит о будущих экспериментах. Существует частая концепция интервала прогнозирования, которая применима непосредственно здесь: вопрос репликации просто касается интервала прогнозирования для p-значения одного будущего эксперимента. Ответ хорошо обоснован в классической статистической теории, не требует инновационных концепций и (определенно) не является байесовским по духу.
whuber

2
@whuber, копаясь в газете, я полагаю, что в основе упражнения может лежать неявное байесовское предположение (см. мой ответ).
GeoMatt22

1
@ GeoMatt Да, это выглядит как единственный способ оправдать расчеты.
whuber

10

@ GeoMatt22 уточнил этот вопрос, и я был рад видеть, что @GeoffCumming приезжает сюда для участия в обсуждении. Я публикую этот ответ в качестве дополнительного комментария.


Как выясняется, эта дискуссия восходит, по крайней мере, к Гудману (1992) . Комментарий к репликации, P-значениям и свидетельствам и более поздний ответ Senn (2002) Письмо в редакцию . Я настоятельно рекомендую прочитать эти две короткие статьи, в частности статью Стивена Сенна; Я полностью согласен с Сенном.

Если бы я прочитал эти статьи до того, как задал этот вопрос, я бы, скорее всего, никогда не разместил бы их. Гудман (в отличие от Камминга) очень четко заявляет, что он рассматривает байесовский сеттинг с плоским предшественником. Он не представляет распределения значения, как это делает Камминг, и вместо этого сообщает вероятности наблюдения «значимого» результата в эксперименте по репликации:р < 0,05pp<0.05

Гудман 1992

Суть его в том, что эти вероятности удивительно малы (даже при это всего ). В частности, для это всего лишь . (Эта последняя вероятность остается неизменной для любых и .)0,78 р = 0,05 0,5 1 / 2 α р = αp=0.0010.78p=0.050.51/2αp=α

Смысл ответа SENN является то , что это полезное наблюдение , которое, однако, не не подрывать -значения в любом случае и вовсе не вопреки Гудман, означает , что -значения «переоценивать доказательства против нулевой». Он пишет:рpp

Я также считаю, что его демонстрация Гудмена полезна по двум причинам. Во-первых, это служит предупреждением для любого, кто планирует дальнейшее подобное исследование с только что завершенным (и которое имеет незначительно значимый результат), что это может не совпадать во втором исследовании. Во-вторых, это служит предупреждением о том, что явное несоответствие результатов отдельных исследований может быть распространенным явлением и что не следует чрезмерно реагировать на это явление.

Сенн напоминает нам, что односторонние могут быть поняты как байесовские апостериорные вероятности для плоского априора для (неправильный априор для всей реальной линии) [см. Краткое обсуждение Marsman & Wagenmakers 2016 об этом факте и некоторых цитатах .H 0 : μ < 0 μpH0:μ<0μ

Если это так, то после получения какого-либо конкретного значения в одном эксперименте вероятность того, что в следующем эксперименте будет получено более низкое значение , должна составлять ; в противном случае будущие повторы могут каким-то образом предоставить дополнительные доказательства перед проведением. Так что вполне логично, что для Гудман получил вероятность . И действительно, все распределения репликации, рассчитанные Cumming и @ GeoMatt22, имеют медианы в соответствующих .р 1 / 2 р = 0,05 0,5 р о б еp p1/2p=0.050.5pobs

Однако нам не нужно, чтобы эта вероятность репликации была выше чтобы полагать, что эффективность лечения вероятна. Длинная серия испытаний, процентов из которых были значительными на уровне процентов, будет убедительным доказательством эффективности лечения.50 50.5505

Кстати, любой, кто смотрел на предсказательные распределения значений , скажем, для t-теста заданного размера и мощности ( см., Например, здесь ), не будет удивлен, что требование медианы при обязательно сделает это распределение довольно широким с толстым хвостом, идущим к . В этом свете широкие интервалы, сообщаемые Каммингом, перестают быть удивительными.р = 0,05 1pp=0.051

То , что они скорее бы предположить, что следует использовать более крупные размеры выборки при попытке повторить эксперимент; и действительно, это стандартная рекомендация для исследований репликации (например, Ури Симонсон предлагает , как правило, увеличить размер выборки в раза).2.5


5
(+1) К счастью , вы не встречались с Гудманом или Сенном, пока не случилось. :-)
кардинал

6

Спасибо всем за дальнейшее интересное обсуждение. Вместо того, чтобы делать свои комментарии, я буду предлагать некоторые общие соображения.

Байеса. Я ничего не имею против байесовских подходов. С самого начала я ожидал, что байесовский анализ, предполагая плоскую или диффузную априорность, даст такие же или очень похожие интервалы прогнозирования. Есть параграф на стр. 291 в статье 2008 года об этом, частично подсказанной одним из рецензентов. Итак, я рад видеть выше, проработка этого подхода. Это здорово, но это совсем другой подход, чем тот, который я выбрал.

Кроме того, я решил работать над пропагандой доверительных интервалов (новая статистика: размеры эффекта, КИ, мета-анализ), а не байесовскими подходами к оценке (на основе достоверных интервалов), потому что я не знаю, как объяснить Байесовский подход к начинающим достаточно хорошо. Я не видел ни одного по-настоящему вводного учебника по Байесу, который, как мне кажется, я мог бы использовать для начинающих, или который, вероятно, будет найден доступным и убедительным для большого числа исследователей. Поэтому нам нужно искать в другом месте, если мы хотим иметь достойный шанс улучшить то, как исследователи делают свои статистические выводы. Да, нам нужно выйти за рамки рценности и переход от дихотомического принятия решений к оценке, и байесовцы могут сделать это. Но гораздо более вероятно добиться практических изменений, имхо, это традиционный подход КИ. Вот почему недавно выпущенный учебник по вводной статистике использует новый подход к статистике. Смотрите www.thenewstatistics.com

Вернуться к размышлениям. Главным в моем анализе является то, что я имею в виду, зная только значение p из первого исследования. Мои предположения изложены (нормальная популяция, случайная выборка, известная популяционная SD, поэтому мы можем использовать z, а не t вычисления, когда мы делаем вывод о средней популяции, точной репликации). Но это все, что я предполагаю. Мой вопрос: «Дано только р из первоначального эксперимента, как далеко мы можем пойти?» Мой вывод заключается в том, что мы можем найти распределение р, ожидаемое от эксперимента репликации. Из этого распределения мы можем получить p интервалов или любую интересующую вас вероятность, такую ​​как вероятность того, что репликация даст p<.05, или любая другая ценность интереса.

Суть аргумента и, возможно, тот шаг, который заслуживает наибольшего размышления, проиллюстрирована на рисунке A2 в статье. Нижняя половина, вероятно, не проблема. Если мы знаем mu (обычно достигаемый, предполагая, что он равен среднему значению из первоначального исследования), тогда ошибки оценки, представленные толстыми отрезками, имеют известное распределение (нормальное, среднее mu, SD, как объяснено в подписи).

Тогда большой шаг: рассмотрим верхнюю половину рисунка 2А. У нас нет информации о му. Нет информации - нет никаких скрытых предположений о предшествующем. Тем не менее, мы можем указать распределение этих толстых отрезков: нормальное, среднее ноль, SD = SQRT (2), умноженное на SD в нижней половине. Это дает нам то, что нам нужно, чтобы найти распределение репликации р .

Результирующие p- интервалы удивительно длинные - по крайней мере, я испытываю удивление, когда сравниваю с тем, как p- значения используются исследователями практически повсеместно. Исследователи, как правило, зацикливаются на втором или третьем десятичном знаке значения p , не понимая, что значение, которое они видят, может очень легко быть совсем другим. Отсюда мои комментарии на стр. 293-4 о том, как сообщать о p- интервалах, чтобы признать неопределенность p .

Долго, да, но это не значит, что p из первоначального эксперимента ничего не значит. После очень низкого начального p репликации будут иметь тенденцию иметь в среднем малые значения p . Более высокие начальные p и репликации будут иметь тенденцию иметь несколько большие значения p . Смотрите Таблицу 1 на стр. 292 и сравните, например, p- интервалы в правом столбце для начальных p = .001 и .1 - два результата, которые традиционно считаются милями друг от друга. Два p- интервала определенно различны, но их огромное совпадение. Репликация эксперимента .001 может довольно легко дать pбольше, чем репликация эксперимента .1. Хотя, скорее всего, это не так.

В рамках своего научного исследования Джерри Лай ( Jeri Lai) сообщил ( Lai, et al., 2011 ) о нескольких хороших исследованиях, которые показали, что опубликованные исследователи из ряда дисциплин имеют субъективные p- интервалы, которые являются слишком короткими. Другими словами, исследователи, как правило, недооценивают, насколько вероятно будет различаться значение p репликации.

Мой вывод заключается в том, что мы просто не должны использовать значения p вообще. Сообщите и обсудите 95% -й доверительный интервал, который передает всю информацию в данных, которая говорит нам о населении, означающем, что мы расследуем. Учитывая CI, значение p ничего не добавляет и, скорее всего, ошибочно предположит некоторую степень определенности (значимо! Не существенно! Эффект существует! Его нет!). Конечно, значения CI и p основаны на одной и той же теории, и мы можем конвертировать из одного в другое (об этом много в главе 6 нашего вводного учебника). Но CI дает гораздо больше информации, чем р . Самое главное, что это делает значительным степень неопределенности. Учитывая нашу человеческую склонность к определенности, степень КИ жизненно важна для рассмотрения.

Я также попытался выделить изменчивость значений p в видеороликах «Dance of the p ». Google «танец значений р ». Есть хотя бы пара версий.

Пусть все ваши доверительные интервалы будут короткими!

Geoff


3
Спасибо за эти дополнительные комментарии, Джефф. Я согласен с некоторыми пунктами здесь (например, «степень уверенности») и не согласен с некоторыми другими (например, «Учитывая CI, значение p ничего не добавляет»), но мне кажется, что нужно повторить одну вещь: я не думаю, что есть какой-либо способ сделать ваш анализ без байесовского предварительного. Аргумент, представленный на вашем рисунке A2, требует плоского априора в качестве скрытого предположения. Можно принять другие приоры и получить совершенно другие результаты; Я не думаю, что есть какой-либо чисто частый аргумент, который может поддержать ваши выводы. Смотрите комментарии @ whuber выше.
говорит амеба: восстанови Монику

@Geoff Cumming - Ваши комментарии о статистическом образовании и интерпретации результатов очень ценятся.
rolando2
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.