Спасибо за интересный вопрос!
Разница: одно ограничение стандартных моделей подсчета состоит в том, что предполагается, что нули и ненулевые (положительные) происходят из одного и того же процесса генерирования данных. В случае моделей препятствий эти два процесса не обязательно должны быть одинаковыми. Основная идея состоит в том, что вероятность Бернулли управляет двоичным результатом того, имеет ли переменная подсчета нулевую или положительную реализацию. Если реализация является положительной, препятствие преодолевается, и условное распределение положительных значений определяется моделью данных с усеченным при нулевом значении. С нулевыми моделямипеременная отклика моделируется как смесь распределения Бернулли (или назовите его точечной массой в нуле) и распределения Пуассона (или любого другого распределения числа, поддерживаемого на неотрицательных целых числах). Для получения более подробной информации и формул см., Например, Gurmu and Trivedi (2011) и Dalrymple, Hudson and Ford (2003).
Пример: модели препятствий могут быть мотивированы последовательными процессами принятия решений, с которыми сталкиваются отдельные лица. Сначала вы решаете, нужно ли вам что-то покупать, а затем вы выбираете количество этого чего-то (что должно быть положительным). Когда вам разрешено (или вы можете потенциально) ничего не покупать после вашего решения о покупке чего-либо, это пример ситуации, когда уместна модель с нулевым уровнем инфляции. Нули могут поступать из двух источников: а) нет решения купить; б) хотел купить, но в итоге ничего не купил (например, нет в наличии).
Бета: Модель препятствий является частным случаем модели, состоящей из двух частей, описанной в главе 16 Frees (2011). Там мы увидим, что для моделей, состоящих из двух частей, объем используемой медицинской помощи может быть как непрерывным, так и переменным числом. Таким образом, то, что в литературе до некоторой степени вводило в заблуждение термин «бета-распределение с нулевым раздуванием», на самом деле относится к классу двухчастных распределений и моделей (так распространенных в актуарной науке), что согласуется с приведенным выше определением модели препятствий , В этой превосходной книге обсуждались модели с нулевым раздувом в разделе 12.4.1 и модели препятствий в разделе 12.4.2 с формулами и примерами из актуарных приложений.
История: модели Пуассона с нулевой раздувкой (ZIP) без ковариат имеют долгую историю (см., Например, Johnson and Kotz, 1969). Общая форма регрессионных моделей ZIP, включающих ковариаты, принадлежит Ламберту (1992). Модели препятствий были впервые предложены канадским статистиком Крэггом (1971), а позднее Муллахи (1986) разработал их. Вы также можете рассмотреть Croston (1972), где положительные геометрические числа используются вместе с процессом Бернулли для описания целочисленного процесса, в котором преобладают нули.
R: Наконец, если вы используете R, есть пакет pscl для «Классов и методов для R, разработанный в вычислительной лаборатории политической науки» Саймона Джекмана, содержащий функции барьера () и zeroinfl () Ахима Цейлиса.
Следующие ссылки были рассмотрены для получения вышеупомянутого:
- Гурму С. и Триведи П. К. Избыточные нули в моделях счета для поездок на отдых Журнал деловой и экономической статистики, 1996, 14, 469-477
- Джонсон Н., Коцц С. Распределения в статистике: дискретные распределения. 1969, Хоутон МиЗин, Бостон
- Ламберт Д., Нулевой инфляцией Пуассона с приложением к дефектам в производстве. Technometrics, 1992, 34 (1), 1–14.
- Крэгг, Дж. Г. Некоторые статистические модели для ограниченных зависимых переменных с применением к спросу на товары длительного пользования Econometrica, 1971, 39, 829-844
- Муллахи Дж. Спецификация и тестирование некоторых модифицированных моделей данных подсчета. Журнал эконометрики, 1986, 33, 341-365.
- Frees, EW регрессионное моделирование с актуарными и финансовыми приложениями Cambridge University Press, 2011
- Dalrymple, ML; Хадсон, Иллинойс и Форд, RPK-модели конечных смесей, модели Пуассона и Хердла с нулевым раздувом и их применение в вычислительной статистике SIDS и анализе данных, 2003, 41, 491-504
- Кростон, JD Прогнозирование и управление запасами для прерывистых требований Оперативные исследования Ежеквартально, 1972, 23, 289-303