Три момента о регрессии Пуассона против нормальной, все о спецификации модели:
Влияние изменений в предикторах
С непрерывным предиктором, таким как оценка по математике, регрессия Пуассона (с обычной ссылкой журнала) подразумевает, что единичное изменение в предикторе приводит к процентному изменению числа наград, т.е. еще 10 баллов по математическому тесту связаны, например, с 25 процентами больше наград. Это зависит от количества наград, которые студент, по прогнозам, уже получит. Напротив, нормальная регрессия связывает еще 10 баллов с фиксированной суммой, скажем, еще 3 награды при любых обстоятельствах. Вы должны быть довольны этим предположением, прежде чем использовать модель, которая его делает. (Я думаю, это очень разумно, по модулю следующий пункт.)
Работа со студентами без наград
Если на многих учеников не будет действительно много наград, то количество наград в основном будет довольно низким. На самом деле я бы предсказал нулевую инфляцию, то есть большинство студентов не получают никакой награды, поэтому множество нулей, а некоторые хорошие студенты получают немало наград. Это противоречит предположениям модели Пуассона и, по крайней мере, так же плохо для модели Нормала.
Если у вас есть приличный объем данных, то модель с «нулевым раздуванием» или «препятствие» будет естественной. Это две модели, связанные друг с другом: одна для прогнозирования того, получит ли студент какие-либо награды, а другая для прогнозирования того, сколько она получит, если вообще получит какую-либо награду (обычно это какая-то модель Пуассона). Я ожидаю, что все действие будет в первой модели.
Награда эксклюзивность
Напоследок небольшой пункт о наградах. Если награды являются исключительными, то есть, если один студент получает награду, то другие студенты не могут получить награду, тогда ваши результаты связаны; один счет для студента а уменьшает возможный счет каждого другого. Стоит ли беспокоиться об этом, зависит от структуры вознаграждений и численности студентов. Я проигнорировал бы это при первом проходе.
В заключение, Пуассон удобно доминирует в Normal, за исключением очень больших подсчетов, но проверьте допущения Пуассона, прежде чем опираться на него для умозаключений, и будьте готовы перейти к более сложному модельному классу в случае необходимости.