На основании вашего последующего комментария кажется, что вы пытаетесь оценить вероятность покрытия доверительного интервала, когда принимаете постоянную дисперсию ошибки, когда истинная дисперсия ошибки не постоянна.
Я думаю об этом так, что для каждого прогона доверительный интервал либо покрывает истинное значение, либо нет. Определите переменную индикатора:
Yi={10if the interval coversif it does not
Тогда вероятность покрытия, которая вас интересует, равна которую вы можете оценить по пропорции выборки, которую, я думаю, вы предлагаете.E(Yi)=p
Как установить количество итераций?
Мы знаем, что дисперсия испытания Бернулли равна , и ваши симуляции будут генерировать испытания IID Бернулли, поэтому дисперсия вашей оценки, основанной на моделировании равна , где - это количество симуляций. Вы можете выбрать чтобы уменьшить эту дисперсию столько, сколько хотите. Это факт, чтоp(1−p)pp(1−p)/nnn
p(1−p)/n≤1/4n
Итак, если вы хотите, чтобы дисперсия была меньше предварительно определенного порога, , то вы можете убедиться в этом, выбрав .δn≥1/4δ
В более общем случае, если вы пытаетесь исследовать свойства распределения выборки оценки с помощью симуляции (например, среднее значение и дисперсию), вы можете выбрать количество симуляций на основе того, какую точность вы хотите достичь в аналогичной модели. мода на то, что описано здесь.
Также обратите внимание, что, когда среднее (или какой-то другой момент) переменной является объектом интереса, как здесь, вы можете построить доверительный интервал для нее на основе моделирования с использованием нормального приближения (то есть центральной предельной теоремы) , как обсуждается в приятном ответе MansT. Это нормальное приближение лучше с ростом числа выборок, поэтому, если вы планируете построить доверительный интервал, обращаясь к центральной предельной теореме, вам нужно, чтобы было достаточно большим, чтобы это можно было применить. Для двоичного случая, как у вас здесь, это приближение кажется хорошим, даже когда и довольно умеренные - скажем, .nnpn(1−p)20
Правда ли, что репликация больше, чем необходимо, может привести к ложным искажениям? Если так, как это?
Как я уже упоминал в комментарии, это зависит от того, что вы подразумеваете под ложным. Большее число симуляций не приведет к смещению в статистическом смысле, но оно может выявить несущественное смещение, которое заметно только при астрономически большом размере выборки. Например, предположим, что истинная вероятность покрытия ошибочно определенного доверительного интервала составила . Тогда, на самом деле, это не проблема в практическом смысле, но вы можете заметить эту разницу, только если провели массу симуляций.94.9999%