Я собираюсь перепроектировать это из опыта с случаями дискриминации. Я точно могу определить, откуда взялись значения «один в 741» и т . Д. Однако при переводе было потеряно столько информации, что остальная часть моей реконструкции основана на том, как люди наблюдают за статистикой в зале суда. Я могу только догадываться о некоторых деталях.
Со времени принятия антидискриминационных законов в 1960-х годах (Раздел VI) суды в Соединенных Штатах научились смотреть на значения p и сравнивать их с пороговыми значениями и 0,01 . Они также научились смотреть на стандартизированные эффекты, обычно называемые «стандартными отклонениями», и сравнивать их с порогом «двух-трех стандартных отклонений». Для того, чтобы установить prima facie случай для иска о дискриминации, истцы обычно пытаются статистический расчет, показывающий «несопоставимое воздействие», которое превышает эти пороговые значения. Если такой расчет не может быть поддержан, дело обычно не может продвигаться вперед.0.050.01
Статистические эксперты для истцов часто пытаются сформулировать свои результаты в этих знакомых терминах. Некоторые из экспертов проводят статистический тест, в котором нулевая гипотеза выражает «отсутствие неблагоприятного воздействия», предполагая, что решения о трудоустройстве были чисто случайными и не зависели от каких-либо других характеристик работников. (Является ли это односторонним или двусторонним вариантом, может зависеть от специалиста и обстоятельств.) Затем они преобразуют значение p этого теста в ряд «стандартных отклонений», ссылаясь на стандартное нормальное распределение - - даже если стандартная норма не имеет отношения к исходному тесту. На этом окольном пути они надеются четко сообщить свои выводы судье.
Предпочтительным тестом для данных, которые можно суммировать в таблицах непредвиденных обстоятельств, является точный тест Фишера. Появление «точного» в его названии особенно приятно истцам, поскольку оно означает статистическое определение, которое было сделано без ошибок (что бы это ни было!).
Вот моя (умозрительная реконструкция) расчеты Министерства труда.
χ2
Они преобразовали его p-значение в нормальную Z-оценку («число стандартных отклонений»).
Они округлили Z балл до ближайшего целого числа: «превышает три стандартных отклонения», «превышает пять стандартных отклонений» и «превышает шесть стандартных отклонений». (Поскольку некоторые из этих Z-показателей округляли до более стандартных отклонений, я не могу оправдать «превышение»; все, что я могу сделать, это процитировать его.)
В жалобе эти интегральные Z-оценки были преобразованы обратно в p-значения! Снова использовалось стандартное нормальное распределение.
Эти p-значения описываются (возможно, вводящим в заблуждение) как «вероятность того, что этот результат произошел по случайности».
1/12801/5650001/5800000073011601307301160130−3.16−4.64−5.521/7411/35000001/1000000000
Вот некоторый R
код, используемый для выполнения этих расчетов.
f <- function(total, percent.asian, hired.asian, hired.non.asian) {
asian <- round(percent.asian/100 * total)
non.asian <- total-asian
x <- matrix(c(asian-hired.asian, non.asian-hired.non.asian, hired.asian, hired.non.asian),
nrow = 2,
dimnames=list(Race=c("Asian", "non-Asian"),
Status=c("Not hired", "Hired")))
s <- fisher.test(x)
s$p.value
}
1/pnorm(round(qnorm(f(730, 77, 1, 6))))
1/pnorm(round(qnorm(f(1160, 85, 11, 14))))
1/pnorm(round(qnorm(f(130, 73, 4, 17))))