Отрицательное биномиальное распределение стало популярной моделью для подсчета данных (в частности, ожидаемое количество считываний секвенирования в пределах данной области генома из данного эксперимента) в биоинформатике. Объяснения различаются:
- Некоторые объясняют это как то, что работает как распределение Пуассона, но имеет дополнительный параметр, предоставляющий больше свободы для моделирования истинного распределения с дисперсией, не обязательно равной среднему
- Некоторые объясняют это как взвешенную смесь распределений Пуассона (с распределением гамма-смешения по параметру Пуассона)
Есть ли способ привести эти логические обоснования в соответствие с традиционным определением отрицательного биномиального распределения, которое моделирует число успехов испытаний Бернулли, прежде чем увидеть определенное количество неудач? Или я должен просто думать об этом как о счастливом совпадении, что взвешенная смесь распределений Пуассона с распределением гамма-смешивания имеет ту же функцию вероятности, что и отрицательный бином?