Нужен ли анализ мощности в байесовской статистике?


19

В последнее время я изучаю байесовский подход к классической статистике. После прочтения о байесовском факторе мне стало интересно, необходим ли анализ мощности в этом виде статистики. Моя главная причина удивления - это фактор Байеса, который на самом деле просто выглядит как отношение правдоподобия. Как только это становится 25: 1, кажется, что я могу назвать это ночью.

Я далеко? Любое другое чтение я могу сделать, чтобы узнать больше? В настоящее время читаю эту книгу: Введение в байесовскую статистику , WM Bolstad (Wiley-Interscience; 2nd ed., 2007).



Ответы:


10

Власть о длительной вероятности р <0,05 (альфа) в будущих исследованиях. В Байесе доказательства из исследования А подразделяются на приоры для исследования В и т. Д. В дальнейшем. Таким образом, сила, как это определено в статистике часто, на самом деле не существует.


12
Менее ограниченный взгляд на силу рассматривает его как выражение кривой риска для функции потерь 0-1. Байесовский анализ объединяет этот риск с предшествующей вероятностью. Тем не менее, хороший байесовский анализ учитывает чувствительность их результатов к выбору предварительного распределения. Казалось бы, это вернет нас обратно в область анализа мощности. Хотя он может не называться этим именем и будет рассчитываться по-разному, цель будет той же: определение размера выборки, чтобы быть уверенным в достижении целей исследования.
whuber

2
Это очень хороший момент, Вубер. Однако это не единственная причина для расчета мощности, и многие байесовцы утверждают, что в этом нет необходимости, поскольку вам не нужно заранее определять N (ошибка).
Джон

5
N

2
Я не придумал эту идею, есть ряд статей, в которых байесовцы утверждают, что вы можете добавлять предметы до тех пор, пока у вас не будет достаточно веских доказательств для принятия решения, в отличие от частого тестирования, где такие процедуры тестирования и добавления не работают. Я мог бы найти ссылку, я полагаю. В первую очередь это касается предложения о том, как анализировать данные в клинических испытаниях.
Джон

8
N

14

Вы можете выполнить проверку гипотез с байесовской статистикой. Например, можно сделать вывод, что эффект больше нуля, если более 95% апостериорной плотности больше нуля. Или, альтернативно, вы можете использовать некоторую форму двоичного решения, основанного на байесовских факторах.

Как только вы создадите такую ​​систему принятия решений, можно оценить статистическую мощность, исходя из заданного процесса генерирования данных и размера выборки. Вы можете легко оценить это в данном контексте, используя симуляцию.

Тем не менее, байесовский подход часто фокусируется больше на интервале достоверности, чем на точечной оценке, и степени убежденности, а не на бинарном решении. Используя этот более непрерывный подход к выводу, вы могли бы вместо этого оценить другие эффекты на вывод вашего дизайна. В частности, вы можете оценить ожидаемый размер вашего интервала достоверности для данного процесса генерирования данных и размер выборки.


3

Эта проблема приводит к большому количеству недоразумений, потому что люди используют байесовскую статистику, чтобы задавать частые вопросы. Например, люди хотят определить, лучше ли вариант B, чем вариант A. Они могут ответить на этот вопрос с помощью байесовской статистики, определив, является ли интервал 95% наибольшей плотности разницы между этими двумя задними распределениями (BA) больше 0 или область практического значения около 0. Если вы используете байесовскую статистику для ответов на часто задаваемые вопросы, тем не менее, вы все равно можете делать частые ошибки: тип I (ложные срабатывания; оппозиции - B на самом деле не лучше) и тип II (мисс; не понимают что Б действительно лучше).

Целью анализа мощности является уменьшение ошибок типа II (например, с вероятностью не менее 80% найти эффект, если он существует). Анализ мощности должен также использоваться при использовании байесовской статистики, чтобы задавать частые вопросы, подобные приведенному выше.

Если вы не используете анализ мощности, а затем вы неоднократно просматриваете свои данные во время сбора и затем останавливаетесь только после того, как обнаружите существенную разницу, то вы будете совершать больше ошибок типа I (ложные тревоги), чем вы ожидаете - так же, как если бы вы использовали частую статистику.

проверять, выписываться:

https://doingbayesiandataanalysis.blogspot.com/2013/11/optional-stopping-in-data-collection-p.html

http://varianceexplained.org/r/bayesian-ab-testing/

Следует отметить, что некоторые байесовские подходы могут уменьшить, но не исключить, вероятность ошибки типа I (например, соответствующий информационный предварительный отчет).


0

Например, необходимость в анализе мощности в клинических испытаниях заключается в том, чтобы иметь возможность рассчитать / оценить, сколько участников набрать, чтобы иметь шанс найти эффект лечения (заданного минимального размера), если он существует. Невозможно набрать бесконечное количество пациентов, во-первых, из-за нехватки времени и, во-вторых, из-за нехватки средств.

Итак, представьте, что мы применяем байесовский подход к упомянутому клиническому испытанию. Хотя плоские априорные значения теоретически возможны, чувствительность к априорному в любом случае целесообразна, поскольку, к сожалению, доступно более одного плоского априора (что странно, я сейчас думаю, поскольку на самом деле должен быть только один способ выразить полную неопределенность).

Итак, представьте себе, что в дальнейшем мы проводим анализ чувствительности (модель, а не только предыдущая также будет находиться под пристальным вниманием). Это включает в себя моделирование из правдоподобной модели «истины». В классической статистике / статистике есть четыре кандидата на «правду»: H0, mu = 0; H1, mu! = 0, где либо наблюдаются с ошибкой (как в нашем реальном мире), либо без ошибки (как в ненаблюдаемом реальном мире). В байесовской статистике здесь есть два кандидата на «правду»: mu - случайная величина (как в ненаблюдаемом реальном мире); mu - это случайная величина (как в нашем наблюдаемом реальном мире с точки зрения неопределенного индивида).

Так что на самом деле все зависит от того, кого вы пытаетесь убедить: а) с помощью испытания и б) с помощью анализа чувствительности. Если это не тот же человек, это было бы довольно странно.

На самом деле речь идет о консенсусе относительно того, что такое истина и на чем основаны материальные доказательства. Общим основанием является то, что сигнатурные вероятностные распределения наблюдаются в нашем реальном наблюдаемом мире, который в некотором роде, очевидно, имеет некоторую основополагающую математическую истину, которая случайно оказывается таковой или является намеренной. Я остановлюсь на этом, поскольку это не страница искусств, а страница науки, или это мое понимание.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.