В нулевой накачанной случае Пуассона, если , то β и λ оба имеют ту же длину, что является число столбцов B или G . Таким образом, количество параметров в два раза превышает количество столбцов матрицы проекта, то есть вдвое больше объясняющих переменных, включая точку пересечения (и любое фиктивное кодирование, которое было необходимо).B=GβλBG
В прямой пуассоновской регрессии не нужно беспокоиться о векторе, нет необходимости оценивать λ . Таким образом, количество параметров - это только длина β, то есть половина количества параметров в случае с нулевым раздувом.pλβ
Теперь нет особой причины, по которой должен равняться G , но обычно это имеет смысл. Однако можно представить процесс генерирования данных, в котором вероятность наличия каких-либо событий вообще создается одним процессом G λ, а совершенно другой процесс B β определяет количество событий при ненулевых событиях. В качестве надуманного примера я выбираю классные комнаты на основе их результатов экзамена по истории, чтобы сыграть в какую-то несвязанную игру, а затем наблюдаю количество забитых ими голов. В этом случае B может сильно отличаться от G (если результаты экзамена по истории отличаются от результатов вождения в игре) и β и λBGGλBβBGβλ иметь разную длину. может иметь больше столбцов, чем B или меньше. Таким образом, модель Пуассона с нулевым давлением в этом случае будет иметь больше параметров, чем простая модель Пуассона.GB
В обычной практике я думаю, что большую часть времени.G=B