Порог выбирается таким, чтобы он обеспечивал сходимость гипергеометрического распределения ( - это ее SD) вместо биномиального распределения (для выборки с заменой) к нормальному распределению (это центральная предельная теорема, см., Например,нормальную кривую, центральную предельную теорему и неравенства Маркова и Чебычева для Случайные величины). Другими словами, когдаn/N≤0,05(т. Е.не слишком велико по сравнению с), FPC можно безопасно игнорировать; это легко увидетькак фактор коррекции эволюционирует с переменнымпри фиксированномN: сN=10,000, мы имеемFPC=N- нN- 1----√п / Н≤ 0,05N nNNNNN= 10 , 000 , когда п = 10 , а FPC = .3162 , когда п = 9 , 000 . Когда N → ∞ , FPC приближается к 1, и мы близки к ситуации выборки с заменой (т. Е. Как с бесконечной населенностью).FPC = .9995n = 10FPC = .3162n = 9 , 000N→ ∞
Чтобы понять эти результаты, хорошей отправной точкой является чтение некоторых онлайн-учебников по теории выборки, где выборка производится без замены ( простая случайная выборка ). Этот онлайн-учебник по непараметрической статистике содержит иллюстрацию по вычислению ожиданий и дисперсии в целом.
Вы заметите, что некоторые авторы используют вместо N - 1 в знаменателе FPC; на самом деле, это зависит от того, работаете ли вы с выборкой или статистикой популяции: для дисперсии это будет N вместо N - 1, если вас интересует S 2, а не σ 2 .NN−1NN−1S2σ2
Что касается онлайн-ссылок, я могу предложить вам