Нахождение точности оценки моделирования Монте-Карло


12

Фон

Я проектирую симуляцию Монте-Карло, которая объединяет результаты ряда моделей, и я хочу быть уверенным, что симуляция позволит мне сделать разумные заявления о вероятности смоделированного результата и точности этой вероятностной оценки.

В ходе симуляции будет найдена вероятность того, что суд присяжных, выбранный из указанного сообщества, осудит определенного подсудимого. Это шаги симуляции:

  1. Используя существующие данные, создайте модель логистической вероятности ( M ), регрессируя «голосование при первом голосовании присяжных» на демографические предикторы.

  2. Используйте методы Монте-Карло для моделирования 1000 версий M (то есть 1000 версий коэффициентов для параметров модели).

  3. Выберите одну из 1000 версий модели ( M i ).

  4. Empanel 1000 присяжных, случайным образом выбирая 1000 наборов из 12 «присяжных» из «сообщества» ( C ) лиц с определенными демографическими характеристиками.

  5. Детерминистически рассчитать вероятность первого голосования виновным для каждого присяжного заседателя, используя M i .

  6. Визуализируйте вероятный голос каждого «присяжного заседателя» в определенный голос (в зависимости от того, является ли он больше или меньше случайно выбранного значения в диапазоне 0–1).

  7. Определите «окончательное голосование» каждого «жюри», используя модель (полученную из эмпирических данных) вероятности того, что присяжные будут признаны виновными, в зависимости от доли присяжных, проголосовавших за осуждение при первом голосовании.

  8. Сохраните долю обвинительных приговоров на 1000 присяжных ( PG i ).

  9. Повторите шаги 3-8 для каждого из 1000 смоделированных версий M .

  10. Вычислить среднее значение PG и отчет о том , что в качестве точечной оценки вероятности осуждения в  C .

  11. Определите значения процентилей 2,5 и 97,5 для PG и сообщите о них как 0,95 доверительный интервал.

В настоящее время я использую 1000 присяжных и 1000 присяжных по теории, что 1000 случайных отборов из распределения вероятностей - демографические характеристики C или версии M - заполнят это распределение.

Вопросов

Позволит ли это мне точно определить точность моей оценки? Если да, то сколько присяжных мне нужно опекать для каждого вычисления PG i, чтобы покрыть распределение вероятности C (поэтому я избегаю смещения выбора); могу ли я использовать менее 1000?

Большое спасибо за любую помощь!


Просто из любопытства: обусловлено ли что-либо в этой модели тем, действительно ли обвиняемый виновен ?
whuber

Модель основана на ответах опроса на единый шаблон фактов, поэтому фактическая вина не меняется. Я предсказать , как различные присяжные вышли бы в одном оспариваемой случае.
Мэгги,

Хорошо, шучу в сторону, вы сообщаете о трех оценках: среднее и 2,5 и 97,5 процентили PG. Для каких (-их) вам нужно «точное» определение и насколько оно должно быть точным?
whuber

Кроме того, шаг (6) является загадочным. Не могли бы вы объяснить, для чего он предназначен? Существуют ли разные «случайно выбранные значения» для каждого присяжного (5), каждого присяжного (4), каждой модели (3) или какой-либо их комбинации?
whuber

1
(См. Выше комментарий) Я думаю, что я могу уменьшить (а) количество присяжных. Ошибка выборки является функцией количества выборок. С 1000 присяжных на модель у меня всего миллион образцов. Ошибка выборки, связанная с 10 ^ 6 выборками, составляет ~ 0,1%. Если бы я использовал только 35 присяжных на модель, у меня было бы 3,5 * 10 ^ 4 выборок и ошибка выборки ~ 0,5%. Эта ошибка выборки намного меньше, чем моя ошибка измерения ~ 5,0%. Поэтому я должен иметь возможность использовать 35 присяжных для каждой модели и просто использовать ошибку измерения для оценки моего доверительного интервала.
Мэгги

Ответы:


4

Существует один общий и "вселенский" критерий благости Монте-Карло - сходимость.

Придерживайтесь одного M и проверьте, как PG ведет себя с количеством присяжных - оно должно сходиться, поэтому покажет вам количество повторений, для которых у вас будет разумное (для вашего приложения) количество значащих цифр. Повторите этот тест для нескольких других M, чтобы убедиться, что вам не повезло с выбором M, а затем перейдите ко всей симуляции.


1
Не уверен, что кто-то полностью отвечал на вопрос. Он состоит из двух частей: (1) Предоставляет ли описанная стратегия моделирования оправданное решение проблемы, которую она хочет решить, а именно, какова вероятность того, что присяжные, случайно выбранные из сообщества C , с указанными демографическими характеристиками, проголосуют, чтобы найти обвиняемый виновен? И (2) Если стратегия моделирования является разумной, сколько «присяжных» она должна выбрать и сколько «вердиктов» она должна смоделировать для каждого, чтобы сообщить обоснованную оценку вероятности осуждения и 0,95 ДИ? Она хочет сэкономить на компьютерах. Смотрите ее последний комментарий
dmk38

0

Мне кажется, что проблема в том, является ли модель слишком сложной, чтобы ее можно было увидеть без использования моделирования Монте-Карло.

Если модель все относительно проста, то должна быть возможность просмотреть ее через обычную статистику и найти решение задаваемого вопроса, без повторного запуска модели несколько раз. Это немного упрощает, но если все, что вы делали из своей модели - это получение точек на основе нормального распределения, то вы могли бы легко получить ответы, которые вы ищете. Конечно, если модель такая простая, то вам вряд ли понадобится провести симуляцию по методу Монте-Карло, чтобы найти свои ответы.

Если проблема сложная и ее невозможно разбить на более элементарную, модель Монте-Карло является правильным типом модели для использования, но я не думаю, что существует какой-либо способ определения доверительных границ без запуска модели. В конечном счете, чтобы получить описанный тип доверительных интервалов, его модель придется запускать несколько раз, распределение вероятностей должно соответствовать выходным значениям, и оттуда могут быть определены доверительные пределы. Одна из проблем моделирования Монте-Карло состоит в том, что модели дают хорошие и регулярные ответы для распределений в среднем диапазоне, но хвосты часто дают гораздо более переменные результаты, что в конечном итоге означает больше прогонов для определения формы выходных сигналов на уровне 2,5% и 97,5% процентили.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.