Я занимаюсь изучением заболеваний GWAS SNP с помощью программного обеспечения под названием plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
С результатами ассоциации я получаю p-значения для всех SNP, которые были проанализированы. Теперь я использую QQ-график этих значений p, чтобы показать, отличается ли очень низкое значение p от ожидаемого распределения значений p (равномерное распределение). Если значение p отклоняется от ожидаемого распределения, можно «назвать» это значение p для статистически значимого значения.
Как вы можете видеть на графике QQ, на верхнем хвостовом участке последние 4 точки довольно сложно интерпретировать. Две из последних точек серого цвета указывают на то, что эти p-значения находятся в ожидаемом распределении p-значений, а два других - нет.
Теперь, как интерпретировать это, последние две точки имеют более низкие значения p, но не являются «значимыми» в соответствии с QQ-графиком, в то время как две другие точки с более высокими значениями p являются «значимыми»? Как это может быть правдой?