Примеры процессов, которые не Пуассона?


15

Я ищу несколько хороших примеров ситуаций, которые не подходят для моделирования с распределением Пуассона, чтобы помочь мне объяснить распределение Пуассона студентам.

В качестве примера, который можно смоделировать с помощью распределения Пуассона, обычно используют количество покупателей, приходящих в магазин за интервал времени. Я ищу контрпример в аналогичном ключе, то есть ситуацию, которую можно рассматривать как процесс положительного счета в непрерывном времени, который явно не является пуассоновским.

В идеале ситуация должна быть как можно более простой и понятной, чтобы ученики могли легко ее понять и запомнить.


5
Этот вопрос необычайно широк. Если область действия не сужается и не добавляется еще какой-то контекст, очень вероятно, что он окажется закрытым. Не имея смысла звучать излишне грубо, это все равно что спросить: «Каковы некоторые примеры цветов, которые не красные?» (Кий Гарри Чапин.)
кардинал

1
Дело принято. Мои извенения. Я должен был сделать это более конкретным. Я отредактировал это, чтобы попытаться сделать это более ясным.
Нагель

1
(+1) к вопросу и комментарию. Обновление намного лучше. :-)
кардинал

2
Я предполагаю, что вы имеете в виду «данные процессы, для которых люди могут, по крайней мере, наивно рассматривать Пуассона» (например, процесс подсчета). Распространенным примером является количество требований по полисам общего страхования (P & C), что обусловлено рядом возможных факторов, наиболее явно отражающихся в неоднородности ставок требований - поэтому существует суперпозиция пуассоновских процессов с различной интенсивностью. В ситуациях, когда распределение количества требований хорошо аппроксимируется гамма-распределением, распределение количества требований, в свою очередь, аппроксимируется отрицательным биномом.
Glen_b

Ответы:


5

Количество сигарет, выкуриваемых за определенный период времени: для этого требуется процесс с нулевым раздуванием (например, с нулевым раздутием Пуассона или с нулевым раздуванием отрицательного бинома), потому что не все курят сигареты.


Благодарность! Многие здесь упоминали процессы с нулевым раздуванием, но я думаю, что это самый простой и наглядный пример, который был приведен: Количество сигарет, выкуренных случайно выбранным человеком за определенный период времени.
Нагель

Возможно, есть некоторая загвоздка с аргументом «не все курят сигареты», тем не менее, в том, что вы можете утверждать, что этот процесс все еще Пуассона, только то, что параметр интенсивности специфичен для каждого человека и неизвестен (у некурящих было бы очень мало интенсивность) - верно? Однако можно также утверждать, что эта ситуация нарушает допущения Пуассона в том, что выкуриваемые сигареты будут иметь тенденцию равномерно распределяться в течение дня (для обычных курильщиков) или кластера (для социальных курильщиков), так что непересекающиеся интервалы времени не являются независимыми. Так что это все еще хороший пример, я думаю.
Нагель

1
Я думаю, что количество пойманной рыбы за определенный период времени является более каноническим примером для ZIP и ZINB. Подобные аргументы. Хотя рыба не обладает способностью вызывать зависимость от скорости потребления. (Я знаю, я знаю, для рыб вашей мамы , за исключением, потому что они что хорошо :).
Алексис

8

Вы имеете в виду данные положительного счета? Неограниченные?

Негативный бином является популярным.

Другая хорошая модель - это Пуассон с завышенным 0. Эта модель предполагает, что либо что-то происходит, либо нет - и если это так, то следует Пуассону. Я видел пример недавно. Медсестер, которые лечили больных СПИДом, спросили, как часто они испытывали стигматизирующее поведение со стороны других людей в результате их общения с больными СПИДом. У большого числа людей никогда не было такого опыта, возможно, из-за того, где они работали или жили. Среди тех, кто это сделал, количество стигматизирующих переживаний было различным. Сообщалось о большем количестве 0, чем вы ожидаете от обычного Пуассона, в основном потому, что определенная часть исследуемой группы просто не находилась в среде, которая подвергает их такому поведению.

Смесь Пуассона также даст вам точечный процесс.


(+1) для распределения Пуассона с нулями. Обсуждение этой модели можно найти здесь

1
+1 к этому (и другим ответам), которые предоставляют реальные примеры ситуаций, упомянутых в вопросе, а не просто абстрактные распределения. Этот пример ZIP особенно ясен.
whuber

1
К чести тех, кто ответил, я должен отметить, что мой вопрос изначально был слишком небрежным и вообще не касался ситуаций. Я согласен, что накачанный нулями Пуассон является хорошим примером. Тем не менее, я нахожу это слишком сложным, чтобы объяснять студентам старшекурсников, поэтому мне все еще не хватает примеров простых ситуаций, которые не могут быть смоделированы распределением Пуассона.
Нагель

4

Считать процессы, которые не Пуассона? Ну, любой конечный выборочный процесс типа биномиального или дискретного равномерного. Вы получаете процесс подсчета Пуассона от подсчета событий, имеющих независимые времена поступления, которые экспоненциально распределены, так что целый ряд обобщений выпадает из этого, таких как наличие гамма или логнормального или распределенного Вейбулла времени взаимодействия, или любого вида абстрактного непараметрического времени взаимодействия распределение.


Спасибо за ваш ответ, и мне очень жаль, что мой вопрос изначально был настолько неясным. Я уточнил это сейчас. То, что вы говорите о процессах с неэкспоненциальным и / или зависимым временем взаимодействия, имеет смысл, но есть ли у вас примеры ситуаций, которые будут иметь эти свойства: чем проще, тем лучше?
Нагель

4
Вы держите пари! Время между вспышками вируса герпеса. У вас гораздо больше времени до первоначальной вспышки, потому что вы действительно должны заразиться вирусом. После этого ваши интервалы между вспышками не зависят друг от друга, но идут гораздо быстрее по сравнению со вспышкой индекса. Неэкспоненциальные времена взаимодействия являются нормой. В анализе выживания обычно используемый аналитический метод - это модели пропорциональных рисков Кокса, в которых вы отбрасываете любые параметрические предположения о временах взаимодействия.
AdamO

Хороший пример! Я предполагаю, что это еще один случай с нулевым раздутием Пуассона, упомянутого Плацидией выше?
Нагель

4

Неясно, хотите ли вы считать процессы или нет.

Если я интерпретирую тег «обучение», чтобы обозначить, что вы обучаете процессу Пуассона, то для обучения процессу в целом процесс Бернулли представляет собой простой случайный процесс, который можно объяснить и визуализировать и который связан с процессом Пуассона. Процесс Бернулли является дискретным аналогом, поэтому он может быть полезным сопутствующим понятием. Просто вместо непрерывного времени у нас есть дискретные интервалы времени.

Примером может служить продавец от двери до двери, где мы рассчитываем успехи по домам, которые совершают покупки.

  • Число успехов в первых n испытаниях, имеет биномиальное
    распределение B (n, p) вместо Пуассона
  • Количество испытаний, необходимых для получения r успехов, имеет отрицательное биномиальное распределение NB (r, p) вместо гамма-распределения
  • Число испытаний, необходимых для достижения одного успеха, времени ожидания, имеет геометрическое распределение NB (1, p), которое является дискретным аналогом экспоненты.

Именно этот подход Берцекас и Цициклис используют во введении к вероятности , 2-е изд., Представляя процесс Бернулли перед пуассоновским процессом. В их учебнике есть больше расширений процесса Бернулли, которые применимы к процессу Пуассона, таких как их слияние или разбиение, а также наборы задач с решениями.

Если вы ищете примеры случайных процессов и просто хотите выбросить имена, их немало.

Гауссовский процесс является значительным в приложениях. В частности, процесс Вейнера, который представляет собой тип гауссовского процесса, также называется стандартным броуновским движением и имеет приложения в области финансов и физики.


Спасибо за ваш ответ, и мне очень жаль, что мой вопрос изначально был настолько неубедительным и неясным. Я попытался уточнить это сейчас. Связь Бернулли с Пуассоном интересна, но я ищу примеры ситуаций в непрерывном времени, которые не подходят для моделирования по пуассоновскому распределению: чем проще, тем лучше.
Нагель

3

Как актуарий имущества / пострадавших, я имею дело с реальными примерами дискретных процессов, которые не являются пуассоновскими постоянно. Для высокоприоритетных и низкочастотных бизнес-направлений распределение Пуассона не подходит, так как требует отношения дисперсии к среднему значению 1. Упомянутое выше отрицательное биномиальное распределение используется гораздо чаще, а распределения Делапорта используется в некоторой литературе, хотя реже в стандартной североамериканской актуарной практике.

Почему это так - более глубокий вопрос. Неужели отрицательный бином намного лучше, потому что он представляет собой пуассоновский процесс, для которого средний параметр сам является гамма-распределенным? Или это происходит потому, что случаи потери не достигают независимости (как в случае землетрясения в соответствии с современной теорией, что чем дольше длится ожидание скольжения земли, тем более вероятно, что это происходит из-за повышения давления), является ли она нестационарной (интервалы не может быть разделен на последовательности, каждая из которых является стационарной, что позволяет использовать неоднородный Пуассон), и, конечно, некоторые виды бизнеса допускают одновременные случаи (например, врачебная халатность с несколькими врачами, охватываемыми политикой).


2

Другие упоминали несколько примеров точечных процессов, которые не являются пуассоновскими. Поскольку пуассоновское время соответствует экспоненциальному временному интервалу, если вы выберете любое временное распределение времени, которое не является экспоненциальным, результирующий точечный процесс не является пуассоновским. АдамО указал на Вейбулла. Вы можете использовать гамма, логнормальный или бета в качестве возможных вариантов.

Пуассон обладает тем свойством, что его среднее значение равно его дисперсии. Точечный процесс, который имеет дисперсию, превышающую среднее значение, иногда называют перераспределением, и, если среднее значение превышает дисперсию, он недостаточно рассеян. Эти термины используются, чтобы связать процесс с Пуассоном. Отрицательный бином часто используется, потому что он может быть слишком рассеянным или рассеянным в зависимости от его параметров.

Пуассон имеет постоянную дисперсию. Точечный процесс, который соответствует условиям Пуассона, за исключением отсутствия постоянного параметра скорости и, следовательно, изменяющегося во времени среднего значения и дисперсии, называется неоднородным Пуассоном.

Процесс с экспоненциальным временем взаимодействия, но может иметь несколько событий в момент прибытия, называется составным Пуассоном. Хотя процесс Пуассона похож на процесс и имеет название со словом Пуассон, неоднородные и составные процессы Пуассона отличаются от точечного процесса Пуассона.


Спасибо за ваш ответ, и мне очень жаль, что мой вопрос изначально был настолько неубедительным и неясным. Я попытался уточнить это сейчас. Вы упоминаете процессы с неэкспоненциальным и / или зависимым временем взаимодействия, и то, что вы говорите о распределении с чрезмерным или недостаточным распределением, очень интересно, но есть ли у вас примеры конкретных ситуаций, которые будут иметь эти свойства? Чем проще, тем лучше :)
Нагель

1
Вместо того, чтобы пытаться дать свой собственный ответ, я думаю, что есть очень много примеров, которые вы можете найти в книгах, посвященных процессам подсчета. Позвольте мне порекомендовать вам взглянуть на книгу Джо Хильбе об отрицательной биномиальной регрессии .
Майкл Р. Черник

2

Другой интересный пример процесса подсчета без Пуассона представлен усеченным до нуля распределением Пуассона (ZTPD). ZTPD может соответствовать данным о количестве языков, на которых субъекты могут говорить в физиологических условиях. В этом случае распределение Пуассона плохо себя ведет, потому что число разговорных языков по определению> = 1: следовательно, 0 исключается априори.


2

Я полагаю, что вы можете воспользоваться процессом Пуассона для прибытия клиентов и настроить его двумя различными способами: 1) количество посетителей измеряется 24 часа в сутки, но магазин фактически не открыт весь день, и 2) представьте себе два конкурирующих магазина с Пуассон обрабатывает время прибытия клиентов и смотрит на разницу между прибытием в два магазина. (Пример №2 основан на моем понимании Руководства по технической статистике Springer, часть A, свойство 1.4.)


1

Возможно, вы захотите пересмотреть пример футбола. Похоже, что количество очков для обеих команд увеличивается по мере продолжения матча, и что они меняются, когда команды меняют свои атакующие / оборонительные приоритеты в ответ на текущий счет.

Или, скорее, используйте его в качестве примера того, как простые модели могут работать на удивление хорошо, стимулируя интерес к статистическому исследованию какого-либо явления и предоставляя ориентир для будущих исследований, которые собирают больше данных для изучения расхождений и предложения разработок.

Dixon & Robinson (1998), "Модель процесса рождения для футбольных матчей ассоциаций", The Statistician , 47 , 3.


Я догадывался, что футбольные матчи были не совсем пуассоновскими, но спасибо за ссылку :)
Нагель

1

Поскольку этот вопрос связан с тем, чтобы сделать распределение Пуассона более понятным, я попробую, поскольку недавно я несколько раз рассмотрел это для шаблонов входящих вызовов в колл-центр (которые следуют экспоненциальному распределению без памяти с течением времени).

Я думаю, что погружение в другую тангенциальную модель, которая, по сути, требует знания Пуассона, чтобы понять, как это не так, может несколько запутать, но это только я.

Я думаю, что проблема с пониманием Пуассона - это непрерывная ось времени, в которой он включен - с каждой секундой событие не будет происходить с большей вероятностью - но чем дальше в будущем, тем более уверенно оно происходит.

На самом деле, я думаю, что это упрощает понимание, если вы просто меняете ось времени на «испытания» или «события».

Кто-то может поправить меня, если это далеко от базы, так как я чувствую, что это простое объяснение, но я думаю, что вы можете заменить бросок монеты или бросок кости на «время до телефонного звонка» (что я обычно используют для укомплектования персоналом Erlang C / call center).

Вместо «время, пока не поступят телефонные звонки» ---- вы можете заменить его на ... «бросает, пока кости не достигают шести».

Это следует той же общей логике. Вероятность (как и любая азартная игра) полностью независима при каждом броске (или минуте) и не требует памяти. Тем не менее, вероятность «нет 6» уменьшается все медленнее, но наверняка к 0, когда вы увеличиваете количество испытаний. Это проще, если вы видите оба графика (вероятность колла со временем, а не вероятность шести с бросками).

Я не знаю, имеет ли это смысл - вот что помогло мне сформулировать это в конкретных терминах. Теперь распределение Пуассона представляет собой счет, а не «время между вызовами» или «испытания до тех пор, пока не выпадет шестерка», но оно зависит от этой вероятности.


Я понимаю, как вы думаете, что это может сбить с толку студентов, но моя идея заключалась в том, чтобы мне было проще объяснить, почему число клиентов, приходящих в ресторан за определенный промежуток времени, составляет Пуассона, если бы у меня был счетчик - пример простого процесса с дискретными событиями в непрерывном времени, который не был Пуассоном.
Нагель

1
Есть много вариантов, я думаю. Одной из очевидных закономерностей могут быть события, которые увеличиваются или уменьшаются с вероятностью их возникновения. Трудно придумать несколько примеров. Возможно муравьи, прибывающие на вашу кухню / пикник. Время, необходимое для прибытия первого муравья, вероятно, намного дольше, чем для второго или третьего, и, конечно, больше прибытий муравьев означает более вероятные будущие прибытия муравьев (учитывая, что их следы / связь друг с другом). Не уверен, что это считается.
Джон Бабсон

1

Количество визитов отдельного покупателя в продуктовый магазин за указанный промежуток времени.

После того, как вы побывали в продуктовом магазине, вы вряд ли вернетесь на какое-то время, если не ошиблись в планировании.

Я думаю, что здесь можно использовать отрицательное биномиальное распределение, но оно дискретно, тогда как посещения происходят в непрерывном времени.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.