Я постараюсь разобраться с этим, хотя я ни в коем случае не статистик, но много занимаюсь «моделированием» - статистическим и нестатистическим.
Сначала давайте начнем с основ:
Что такое модель именно?
Модель - это представление реальности, хотя и сильно упрощенное. Подумайте о восковой / деревянной модели для дома. Вы можете коснуться / почувствовать / обонять это. Теперь математическая модель представляет собой представление реальности с использованием чисел.
Что это за «реальность», которую я слышу, вы спрашиваете? Ладно. Подумайте об этой простой ситуации: губернатор вашего штата проводит политику, согласно которой цена пачки сигарет будет стоить 100 долларов в следующем году. «Цель» состоит в том, чтобы удержать людей от покупки сигарет, тем самым уменьшая курение, тем самым делая курильщиков более здоровыми (потому что они бросили).
Через 1 год губернатор спрашивает вас - был ли это успех? Как ты можешь говорить так? Хорошо, вы собираете данные, такие как количество проданных пакетов / день или в год, ответы на опросы, любые измеримые данные, которые вы можете получить, которые имеют отношение к проблеме. Вы только начали «моделировать» проблему. Теперь вы хотите проанализировать, что говорит эта «модель» . Вот где статистическое моделирование пригодится. Вы можете запустить простой график зависимости / рассеивания, чтобы увидеть, как выглядит модель. Вы можете испытать фантазию, чтобы определить причинно-следственную связь, т. Е. Если повышение цены действительно привело к снижению курения или были другие факторы, вызывающие смешение, то есть (может быть, это что-то совсем другое, и ваша модель, возможно, пропустила это?).
Теперь построение этой модели осуществляется с помощью «набора правил» (более похожих на руководящие принципы), т. Е. Что является / не является законным или что имеет / не имеет смысла. Вы должны знать, что вы делаете и как интерпретировать результаты этой модели. Построение / Выполнение / Интерпретация этой модели требует базовых знаний статистики. В приведенном выше примере вам нужно знать о графиках корреляции / разброса, регрессии (одно- и многомерных) и других вещах. Я предлагаю прочитать абсолютное увлекательное / информативное чтение по интуитивному пониманию статистики: что такое p-значение в любом случае? Это юмористическое введение в статистику, которое научит вас «моделированию» от простого к продвинутому (то есть линейной регрессии). Тогда вы можете продолжить и читать другие вещи.
Итак, помните, что модель - это представление реальности, и что «все модели ошибочны, но некоторые из них более полезны, чем другие» . Модель - это упрощенное представление реальности, и вы не можете рассмотреть все, но вы должны знать, что нужно, а что не следует рассматривать, чтобы иметь хорошую модель, которая может дать вам значимые результаты.
Это не останавливается здесь. Вы можете создавать модели для имитации реальности тоже! Вот так куча чисел будет меняться со временем (скажем). Эти цифры соответствуют некоторой значимой интерпретации в вашем домене. Вы также можете создать эти модели для моих данных , чтобы увидеть , как различные меры связаны друг с другом (применение статистики здесь может быть сомнительной, но не волнуйтесь , сейчас). Пример: вы смотрите на продажи продуктов в магазине в месяц и понимаете, что всякий раз, когда пиво покупается, вы получаете пачку подгузников (вы строите модель, которая просматривает набор данных и показывает вам эту связь). Это может быть странно, но это может означать, что в основном отцы покупают это в выходные дни, когда ребенок сидит с детьми? Положите подгузники рядом с пивом, и вы можете увеличить свои продажи! Ааа! Моделирование :)
Это всего лишь примеры и ни в коем случае не ссылка на профессиональную работу. Вы в основном строите модели, чтобы понять / оценить, как реальность будет / действовала, и принимать лучшие решения на основе результатов. Статистика или нет, вы, вероятно, занимаетесь моделированием всю свою жизнь, не осознавая этого. Удачи :)