Зачем использовать «случайную» достоверность или достоверные интервалы?


16

Недавно я читал статью, в которой случайность включалась в ее достоверность и достоверные интервалы, и мне было интересно, является ли это стандартом (и, если да, то почему это разумно). Чтобы установить обозначения, предположим, что наши данные и мы заинтересованы в создании интервалов для параметра θ Θ . Я привык к доверительным / доверительным интервалам, которые строятся путем построения функцииxXθΘ

fx:Θ{0,1}

и пусть наш интервал будет .I={θΘ:fx(θ)=1}

Это случайное в том смысле, что оно зависит от данных, но при условии данных это просто интервал. Этот документ вместо этого определяет

gx:Θ[0,1]

а также набор iid равномерных случайных величин на [ 0 , 1 ] . Он определяет соответствующий интервал как I = { θ Θ{Uθ}θΘ[0,1] . Обратите внимание, что это во многом зависит от вспомогательной случайности, помимо того, что исходит из данных.I={θΘ:fx(θ)Uθ}

Мне очень любопытно, почему можно так поступить. Я думаю, что «ослабление» понятия интервала от функций типа до функций типа g xfxgx имеет некоторый смысл; это какой-то взвешенный доверительный интервал. Я не знаю каких-либо ссылок на него (и был бы признателен за любые указатели), но это кажется вполне естественным. Тем не менее, я не могу думать ни о какой причине, чтобы добавить вспомогательную случайность.

Любые указатели на литературу / причины для этого будут оценены!


5
(+1) Это называется рандомизированной процедурой. Они являются стандартной частью системы статистической оценки и тестирования, поэтому вы можете полагаться на любой строгий учебник, чтобы дать объяснения. Дополнительную мотивацию для их использования можно найти в литературе по теории игр.
whuber

Спасибо за ответ. После прочтения этого комментария я понял, что, например, самозагрузка вписывается в эту структуру, но в этой ситуации причина рандомизации ясна (у вас нет доступа к f, просто g). В моем случае авторы явно рассчитывают , а затем смотрят на g x . Хотя у меня много учебников по статистике, я нигде этого не вижу ... У вас есть предлагаемый текст? fxgx
QQQ

3
На самом деле, начальная загрузка не является рандомизированной процедурой. Это детерминированная процедура, приблизительный расчет которой осуществляется с помощью случайной выборки.
whuber

Ответы:


4

Рандомизированные процедуры иногда используются в теории, потому что это упрощает теорию. В типичных статистических задачах это не имеет смысла на практике, в то время как в настройках теории игр это может иметь смысл.

Единственная причина, по которой я могу использовать его на практике, заключается в том, что он каким-то образом упрощает вычисления.

U

UPDATE  

Чтобы ответить на комментарии Вубера, приведенные ниже: «Почему рандомизированные процедуры« не имеют смысла на практике »? Как уже отмечали другие, экспериментаторы вполне готовы использовать рандомизацию при построении своих экспериментальных данных, таких как рандомизированное распределение лечения и контроля». Так что же такого особенного (и непрактичного, или нежелательного) в использовании рандомизации в последующем анализе данных? "

Что ж, рандомизация эксперимента для получения данных выполняется с целью, главным образом для разрыва цепей причинности. Если и когда это эффективно, другое обсуждение. Какова может быть цель использования рандомизации как части анализа? Единственная причина, которую я когда-либо видел, состоит в том, что она делает математическую теорию более полной! Это нормально, пока это идет. В контексте теории игр, когда есть реальный противник, рандомизация может помочь мне запутать его. В реальных условиях принятия решения (продавать или не продавать?) Необходимо принять решение, и, если в данных нет доказательств, может быть, можно просто бросить монетку. Но в научном контексте, где вопрос в том, что мы можем узнатьиз данных, рандомизация кажется неуместной. Я не вижу никакой реальной выгоды от этого! Если вы не согласны, есть ли у вас аргумент, который мог бы убедить биолога или химика? (И здесь я не думаю о симуляции как о части начальной загрузки или MCMC.)


1
Почему рандомизированные процедуры «не имеют смысла на практике»? Как уже отмечали другие, экспериментаторы вполне готовы использовать рандомизацию при построении своих экспериментальных данных, таких как рандомизированное распределение лечения и контроля, так что же отличается (и нецелесообразно, или нежелательно) от использования рандомизации в последующем анализе данных ?
whuber

1
@kjetil Я думаю, что вы, возможно, не завершили свое утверждение о принципе достаточности, похоже, оно было обрезано в середине предложения («статистические выводы должны ...»).
Серебряная рыба

1
(+1) Но я думаю, что напрашивается вопрос, чтобы вызвать принцип достаточности, аргумент которого заключается в том, что, как только вы узнаете наблюдаемое значение достаточной статистики, учет любого другого аспекта данных будет эквивалентен введению постороннего случайного числа.U, Таким образом, кто-то, предлагающий сделать это, не станет фигурой для принципа достаточности. Кроме того, см. Basu (1978), «Рандомизация в статистических экспериментах», Статистический отчет бывшего СССР M466 для пары рандомизированных процедур, предложенных всерьез.
Scortchi - Восстановить Монику

1
@whuber: Это четкий, принципиальный аргумент, что рандомизация в получении данных может быть выгодной. (Это разрывает причинные цепи). Что это за принципиальный аргумент в пользу использования рандомизации как части анализа?
kjetil b halvorsen

1
Kjetil: он позволяет вам достичь предполагаемой функции риска, а не принимать функцию риска (часто в форме номинального размера и мощности), которая не является той, которую вы хотели. Более того, если процедура «теоретически» полезна, то, безусловно, не может быть никаких возражений против ее использования на практике, за исключением неосуществимости (что обычно не имеет место в случае рандомизированных процедур). Таким образом, ваш вопрос должен быть перевернут с ног на голову: вы должны продемонстрировать, что что-то не так с использованием рандомизированных процедур. Как сделать это, не противореча себе?
whuber

3

Идея относится к тестированию, но с учетом двойственности тестирования и доверительных интервалов та же логика применима к КИ.

В основном, рандомизированные тесты гарантируют, что данный размер теста может быть получен и для дискретных экспериментов.

Предположим, вы хотите проверить на уровне αзнак равно0,05, честность монеты (вставьте любой пример по вашему выбору, который можно смоделировать с помощью биномиального эксперимента), используя вероятность пголов. То есть вы тестируетеЧАС0:пзнак равно0,5 против (скажем) ЧАС1:п<0,5, Предположим, вы бросили монетуNзнак равно10 раз.

Очевидно, что несколько голов являются доказательством ЧАС0, ЗаКзнак равно2 успехи, мы можем вычислить п-значение теста pbinom(2,10,.5)в R, получая 0,054. ЗаКзнак равно1получаем 0,0107. Следовательно, нет никакого способа отклонить истинноеЧАС0 с вероятностью 5% без рандомизации.

Если мы будем случайным образом отклонять и принимать при наблюдении Кзнак равно2Мы все еще можем достичь этой цели.


Это хорошее объяснение использования рандомизации, но было бы неплохо, если бы оно объяснило, почему мы можем быть заинтересованы в достижении произвольного αна первом месте. Почему это желаемая цель?
Серебряная рыбка

Что ж, это, я думаю, возвращает нас к истории статистики, когда Р.А. Фишер несколько произвольно решил работать с уровнем значимости 5%, чтобы решить, заслуживают ли некоторые первоначальные доказательства дальнейшего изучения. Как мы знаем, 5% с тех пор превратились в своего рода золотой стандарт во многих областях, несмотря на отсутствие хорошей теоретической основы для принятия решений.
Кристоф Ханк
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.