Какова формула для скорректированного p-значения Бенджамини-Хохберга?

Я понимаю процедуру и то, что она контролирует. Итак, какова формула для скорректированного значения p в процедуре ЧД для множественных сравнений?

Только сейчас я понял, что исходная ЧД не выдает скорректированные значения p, а только скорректировала (не) условие отклонения: https://www.jstor.org/stable/2346101 . Гордон Смит в любом случае ввел скорректированные p-значения ЧД в 2002 году, поэтому этот вопрос остается в силе. Это реализовано в R как p.adjustс методом BH.

— поджигатель
источник

В известной оригинальной статье Benjamini & Hochberg (1995) описана процедура принятия / отклонения гипотез, основанная на корректировке уровней альфа. Эта процедура имеет простую эквивалентную переформулировку в терминах скорректированных $p$ значений, но она не обсуждалась в оригинальной статье. По словам Гордона Смита , он ввел скорректированные $p$ в 2002 году при реализации p.adjustв R. К сожалению, нет соответствующей цитаты, поэтому мне всегда было неясно, на что следует ссылаться, если использовать $p$ -значения, скорректированные помощью BH .

Оказывается, процедура описана в Benjamini, Heller, Yekutieli (2009) :

Альтернативным способом представления результатов этой процедуры является представление скорректированных $p$ значений. Скорректированные по ЧД значения $p$ определяются как
$п_{(я)}^{В ЧАС} знак равно мин {\underset{J \geq я}{мин} {\frac{м п_{(J)}}{J}}, 1},$ $p^\mathrm{BH}_{(i)} = \min\Big\{\min_{j\ge i}\big\{\frac{mp_{(j)}}{j}\big\},1\Big\}.$

Эта формула выглядит сложнее, чем есть на самом деле. Это говорит:

Сначала упорядочьте все $p$ от малого к большому. Затем умножьте каждое $p$ значение на общее количество тестов $m$ и разделите его по порядку рангов.
Во-вторых, убедитесь, что результирующая последовательность неубывающая: если она когда-либо начинает уменьшаться, сделайте предыдущее значение $p$ равным последующему (многократно, пока вся последовательность не станет неубывающей).
Если какое-либо значение $p$ окажется больше 1, сделайте его равным 1.

Это простая переформулировка первоначальной процедуры BH с 1995 года. Возможно, существует более ранняя статья, в которой явно вводится концепция скорректированных по BH $p$ значений, но я не знаю ни о какой.

Обновить. @Zenit обнаружил, что Yekutieli & Benjamini (1999) описали то же самое еще в 1999 году:

— амеба говорит восстановить монику
источник

Это ответ, который я ожидал, +1. Я помню, как читал о реализации Гордоном Смитом скорректированного значения p, а также не знал, кого цитировать, здорово видеть, что здесь есть «каноническая» цитата.

— Firebug

Я полагаю, что существует даже более ранняя ссылка: Yekutieli and Benjamini (1999) (PDF-версия доступна здесь ). Определение 2.4 описывает, как оригинальная процедура FDR 1995 года может быть перефразирована в терминах скорректированных значений p. Кредит на этот пост в блоге, где я нашел об этом.

— Зенит

@ Зенит Ого! Отличная находка! Я должен обновить свой ответ.

— говорит амеба: восстанови Монику

Спасибо за источник @Zenit! Довольно странно, что такой вездесущий статистический метод не имеет общеизвестной ссылки.

— Firebug

Сначала ответ на вопрос. Предположим, что является значением (одиночного теста), связанным со значением статистики теста. FDR Бенджамини-Хохберга вычисляется в два этапа ( = # pvalues , = # pvalues): $p_0$ $p$ $z_0$ $N_0$ $\le$ $p_0$ $N$

$\text{FDR }(p_0) = \frac{\quad p_0 \quad }{\frac{N_0}{N}}$
$\text{FDR }(p_i) = \min (\text{FDR}(p_i), \text{FDR}(p_{i+1}))$

Теперь давайте это поймем. (Байесовская) основная идея заключается в том, что наблюдения происходят из смеси двух распределений:

$\pi_0 \: N$ $f_0(z)$
$(1-\pi_0) \: N$ $f_1(z)$

То, что наблюдается, является смесью этих двух:

$f(z) = \pi_0 \cdot f_0(z) + (1-\pi_0) \cdot f_1(z)$

(Байесовские) определения:

$\text{Fdr} = \frac{\pi_0 \: (1-F_0(z_0))}{(1-F(z))}$
$\text{fdr} = \frac{\pi_0 \: f_0(z_0)}{f(z)}$

$\pi_0 \approx 1$

(На основе статистического вывода Эфрона и Тибширани о компьютерном веке )

— Адитья
источник