Этот вопрос вытекает из вопроса о «.632 Правиле». Я пишу с особым вниманием к ответу / примечанию пользователя 603 в той степени, в которой это упрощает вопросы.
Этот ответ начинается с выборки размера с заменой из различных элементов в коллекции (вызов) it N. Вероятность того, что выборка отличается от конкретного элемента из N, равнаn i t h s i m ( 1 - 1 / n ) .
В этом ответе все элементы N имеют одинаковую вероятность случайного выбора.
У меня такой вопрос: предположим, вместо этого, что в приведенном выше вопросе элементы, которые должны быть нарисованы, таковы, что они обычно распределены. То есть мы подразделяем стандартную нормальную кривую от до на (скажем) 100 субинтервалов равной длины. Каждый из 100 элементов в N имеет вероятность быть нарисованным, который равен области, представленной кривой в соответствующем интервале.Z = 4
Мое мышление было следующим:
Я думаю, что рассуждения аналогичны рассмотренному в связанном ответе. Вероятность того, что , с элементом N, равна в которой - это вероятность вытягиванияm P ( s i ≠ m ) = ( 1 - F i ) F i s i .
Вероятность того, что конкретный элемент m находится в образце S размера n, равна
= 1 - п П 1 ( 1 - F я ) .
Расчеты, кажется, показывают, что, поскольку длина подинтервалов становится небольшой, ответ сходится к тому же числу, что и в первом случае (вероятности все равны).
Это кажется нелогичным (для меня), потому что конструкция, кажется, добавляет элементы N, которые редки, поэтому я ожидаю, что число меньше, чем 0,632.
Кроме того, если это правильно, я думаю, мы бы
что я не знаю, чтобы быть правдой или ложью еще.
Изменить: Если это правда, это, вероятно, будет обобщать некоторые.
Спасибо за любые идеи.