Прежде всего, есть много, много разных типов симуляции в статистике, и даже больше в смежных областях. Просто сказать «Моделирование» так же полезно, как сказать «Модель», то есть совсем немного.
Основываясь на остальной части вашего вопроса, я предполагаю, что вы имеете в виду симуляцию Монте-Карло, но даже это немного расплывчато. В принципе, то , что происходит, вы неоднократно брать пробы из в распределении (это не должно быть нормальным), чтобы сделать некоторые статистический анализ на искусственной популяции с известным, но случайным образом , свойства.
Цель этого имеет тенденцию делиться на две категории:
Может ли мой метод обрабатывать X? По сути, вы моделируете серию из множества случайных групп населения с известным «правильным» ответом, чтобы увидеть, дает ли ваша новая техника верный ответ. В качестве базового примера предположим, что вы разработали новый способ измерения корреляции между двумя переменными, X и Y. Вы бы смоделировали две переменные, в которых значение Y зависит от значения X, а также какой-то случайный шум. Например, Y = 0,25x + шум. Затем вы создадите популяцию с некоторыми случайными значениями X, некоторыми значениями Y, которые были 0,25x + случайное число, вероятно, много-много тысяч раз, и затем покажете, что в среднем ваша новая техника выплевывает число, которое правильно показывает, что Y = 0,25x.
Что произойдет, если? Моделирование может быть выполнено как анализ чувствительности для существующего исследования. Скажем, например, я провел когортное исследование, но я знаю, что мое измерение экспозиции не очень хорошее. Это неправильно классифицирует 30% моих предметов как выставленные, когда они не должны быть, и классифицирует 10% моих предметов как незащищенные, когда они не должны быть. Проблема в том, что у меня нет лучшего теста, поэтому я не знаю, какой именно.
Я бы взял свое население и дал бы каждому выставленному субъекту 30% шанс переключения на неэкспонированный, а каждому неэкспонированному субъекту 10% шанс переключения на незащищенного. Затем я собираю тысячи новых групп населения, случайно определяю, какие субъекты переключаются, и повторно провожу свой анализ. Диапазон этих результатов даст мне хорошую оценку того, насколько сильно может измениться результат моего исследования, если бы я мог правильно классифицировать всех.
Конечно, как всегда, есть большая сложность, нюанс и полезность для моделирования, в зависимости от того, сколько вы хотите копать.