Обратите внимание, что в каждой позиции наблюдения ( ) мы можем выбрать любое из наблюдений, поэтому существует возможных повторных выборок (сохраняя порядок, в котором они взяты), из которыхявляются «одной и той же выборкой» (т.е. содержат все исходных наблюдений без повторов; это объясняет все способы упорядочения выборки, с которой мы начали).i=1,2,...,nnnnn!n
Например, с тремя наблюдениями, a, b и c, у вас есть 27 возможных выборок:
aaa aab aac aba abb abc aca acb acc
baa bab bac bba bbb bbc bca bcb bcc
caa cab cac cba cbb cbc cca ccb ccc
Шесть из них содержат по одному из a, b и c.
Таким образом, - это вероятность получения исходного образца обратно.n!/nn
В сторону - быстрое приближение вероятности:
Считайте, что :
2π−−√ nn+12e−n≤n!≤e nn+12e−n
так
2π−−√ n12e−n≤n!/nn≤e n12e−n
При этом нижняя оценка является обычной для приближения Стирлинга (которая имеет низкую относительную ошибку при больших ).n
[Госпер предложил использовать что привело бы к приближению для этой вероятности , который работает достаточно хорошо, вплоть до или даже до зависимости от того, насколько строгими являются ваши критерии.]√n!≈(2n+13)π−−−−−−−−−√nne−n n = 3 n = 1(2n+13)π−−−−−−−−√e−nn=3n=1
(Ответ на комментарий :) Вероятность не получить конкретного наблюдения в данной повторной выборке составляет что для больших составляет приблизительно .ne-1(1−1n)nne−1
Подробнее см.
Почему в среднем каждая стартовая выборка содержит примерно две трети наблюдений?