Фон
Я проектирую симуляцию Монте-Карло, которая объединяет результаты ряда моделей, и я хочу быть уверенным, что симуляция позволит мне сделать разумные заявления о вероятности смоделированного результата и точности этой вероятностной оценки.
В ходе симуляции будет найдена вероятность того, что суд присяжных, выбранный из указанного сообщества, осудит определенного подсудимого. Это шаги симуляции:
Используя существующие данные, создайте модель логистической вероятности ( M ), регрессируя «голосование при первом голосовании присяжных» на демографические предикторы.
Используйте методы Монте-Карло для моделирования 1000 версий M (то есть 1000 версий коэффициентов для параметров модели).
Выберите одну из 1000 версий модели ( M i ).
Empanel 1000 присяжных, случайным образом выбирая 1000 наборов из 12 «присяжных» из «сообщества» ( C ) лиц с определенными демографическими характеристиками.
Детерминистически рассчитать вероятность первого голосования виновным для каждого присяжного заседателя, используя M i .
Визуализируйте вероятный голос каждого «присяжного заседателя» в определенный голос (в зависимости от того, является ли он больше или меньше случайно выбранного значения в диапазоне 0–1).
Определите «окончательное голосование» каждого «жюри», используя модель (полученную из эмпирических данных) вероятности того, что присяжные будут признаны виновными, в зависимости от доли присяжных, проголосовавших за осуждение при первом голосовании.
Сохраните долю обвинительных приговоров на 1000 присяжных ( PG i ).
Повторите шаги 3-8 для каждого из 1000 смоделированных версий M .
Вычислить среднее значение PG и отчет о том , что в качестве точечной оценки вероятности осуждения в C .
Определите значения процентилей 2,5 и 97,5 для PG и сообщите о них как 0,95 доверительный интервал.
В настоящее время я использую 1000 присяжных и 1000 присяжных по теории, что 1000 случайных отборов из распределения вероятностей - демографические характеристики C или версии M - заполнят это распределение.
Вопросов
Позволит ли это мне точно определить точность моей оценки? Если да, то сколько присяжных мне нужно опекать для каждого вычисления PG i, чтобы покрыть распределение вероятности C (поэтому я избегаю смещения выбора); могу ли я использовать менее 1000?
Большое спасибо за любую помощь!