Я пытаюсь сделать макет для себя, когда уместно использовать тип регрессии (геометрический, пуассоновский, отрицательный бином) с данными счета в рамках GLM (только 3 из 8 распределений GLM используются для данных счета, хотя большая часть того, что Я читал центры вокруг отрицательных биномиальных и пуассоновских распределений).
Когда использовать данные Пуассона против геометрических и отрицательных биномиальных GLM для данных подсчета?
Пока у меня есть следующая логика: это считать данные? Если да, то являются ли среднее значение и дисперсия неравными? Если да, отрицательная биноминальная регрессия. Если нет, Пуассона регрессия. Есть ли нулевая инфляция? Если да, то ноль надувает Пуассона или ноль надувает отрицательный бином.
Вопрос 1 Кажется, что нет четкого указания, когда использовать. Есть ли что-то, чтобы сообщить это решение? Из того, что я понимаю, когда вы переключаетесь на ZIP, средняя дисперсия, равная предположению, становится более расслабленной, поэтому она снова очень похожа на NB.
Вопрос 2 Где геометрическое семейство вписывается в этот или какие вопросы мне следует задавать для данных при принятии решения о том, использовать ли геометрическое семейство в моей регрессии?
Вопрос 3 Я вижу людей, которые постоянно меняют отрицательные биномиальные и пуассоновские распределения, но не геометрические, поэтому я предполагаю, что когда-то его использовать, есть нечто совершенно иное. Если так, то, что это?
PS Я сделал (возможно, слишком упрощенно, из комментариев) диаграмму ( редактируемую ) моего текущего понимания, если бы люди хотели прокомментировать / настроить ее для обсуждения.