Учитывая список значений p, полученных из независимых тестов, отсортированных в порядке возрастания, можно использовать процедуру Бенджамини-Хохберга для множественной коррекции тестирования . Для каждого значения p процедура Бенджамини-Хохберга позволяет рассчитать частоту ложных открытий (FDR) для каждого из значений p. То есть, в каждой «позиции» в отсортированном списке значений p он скажет вам, какая часть из них может быть ложным отклонением нулевой гипотезы.
Мой вопрос заключается в том, следует ли называть эти значения FDR « q-значениями » или « скорректированными p-значениями », или как что-то еще целиком?
РЕДАКТИРОВАТЬ 2010-07-12: Я хотел бы более полно описать процедуру коррекции, которую мы используем. Сначала мы сортируем результаты теста по возрастанию по их неоткорректированному исходному значению p. Затем мы выполняем итерацию по списку, вычисляя то, что я интерпретировал как «ожидаемый FDR, если бы мы отвергли нулевую гипотезу для этого и всех предыдущих тестов в списке», используя поправку BH, причем альфа равна наблюдаемой , неоткорректированное p-значение для соответствующей итерации. Затем мы берем, как мы называем наше «q-значение», максимум ранее исправленного значения (FDR на итерации i - 1) или текущего значения (на i), чтобы сохранить монотонность.
Ниже приведен код Python, который представляет эту процедуру:
def calc_benjamini_hochberg_corrections(p_values, num_total_tests):
"""
Calculates the Benjamini-Hochberg correction for multiple hypothesis
testing from a list of p-values *sorted in ascending order*.
See
http://en.wikipedia.org/wiki/False_discovery_rate#Independent_tests
for more detail on the theory behind the correction.
**NOTE:** This is a generator, not a function. It will yield values
until all calculations have completed.
:Parameters:
- `p_values`: a list or iterable of p-values sorted in ascending
order
- `num_total_tests`: the total number of tests (p-values)
"""
prev_bh_value = 0
for i, p_value in enumerate(p_values):
bh_value = p_value * num_total_tests / (i + 1)
# Sometimes this correction can give values greater than 1,
# so we set those values at 1
bh_value = min(bh_value, 1)
# To preserve monotonicity in the values, we take the
# maximum of the previous value or this one, so that we
# don't yield a value less than the previous.
bh_value = max(bh_value, prev_bh_value)
prev_bh_value = bh_value
yield bh_value