Вот некоторый R
код для создания картинки. Он покажет 15 смоделированных p-значений, нанесенных на график в зависимости от их порядка. Таким образом, они образуют шаблон восходящей точки. Точки под красными / фиолетовыми линиями представляют значимые тесты на уровне 0,1 или 0,2. FDR - это количество черных точек под линией, деленное на общее количество точек под линией.
x0 <- runif(10) #p-values of 10 true null hypotheses. They are Unif[0,1] distributed.
x1 <- rbeta(5,2,30) # 5 false hypotheses, rather small p-values
xx <- c(x1,x0)
plot(sort(xx))
a0 <- sort(xx)
for (i in 1:length(x0)){a0[a0==x0[i]] <- NA}
points(a0,col="red")
points(c(1,15), c(1/15 * 0.1 ,0.1), type="l", col="red")
points(c(1,15), c(1/15 * 0.2 ,0.2), type="l", col="purple")
Я надеюсь, что это может дать некоторое представление о форме распределения упорядоченных p-значений. То, что линии правильные, а не, например, какая-то притча в форме кривой, имеет отношение к форме распределения порядка. Это должно быть рассчитано явно. На самом деле, линия - это просто консервативное решение.