В настоящее время я анализирую данные из серии поведенческих экспериментов, которые все используют следующую меру. Участников этого эксперимента просят выбрать подсказки, которые (вымышленные) другие люди могли бы использовать, чтобы помочь решить серию из 10 анаграмм. Участники должны верить, что эти другие люди либо получат, либо потеряют деньги, в зависимости от их результатов в решении анаграмм. Подсказки различаются в том, насколько они полезны. Например, для анаграммы NUNGRIN, анаграммы RUNNING, могут быть три подсказки:
- Двигаться быстро (бесполезно)
- Что вы делаете в марафонской гонке (полезно)
- Не всегда здоровое хобби (бесполезно)
Чтобы сформировать показатель, я подсчитываю, сколько раз (из 10) участник выбирает бесполезную подсказку для другого человека. В экспериментах я использую различные манипуляции, чтобы повлиять на полезность подсказок, которые выбирают люди.
Поскольку мера полезности / бесполезности довольно сильно положительно искажена (большая часть людей всегда выбирает 10 наиболее полезных подсказок), и поскольку мера является переменной подсчета, я использую обобщенную линейную модель Пуассона для анализа этих данных. Однако, когда я сделал еще несколько чтений о регрессии Пуассона, я обнаружил, что, поскольку регрессия Пуассона не оценивает независимо среднее и дисперсию распределения, она часто недооценивает дисперсию в наборе данных. Я начал исследовать альтернативы регрессии Пуассона, такие как квазипуассоновая регрессия или отрицательная биномиальная регрессия. Тем не менее, я признаю, что я довольно новичок в таких моделях, поэтому я прихожу сюда за советом.
Кто-нибудь есть какие-либо рекомендации о том, какую модель использовать для такого рода данных? Есть ли другие соображения, о которых мне следует знать (например, является ли одна конкретная модель более мощной, чем другая?)? На какую диагностику мне следует обратить внимание, чтобы определить, правильно ли выбранная модель обрабатывает мои данные?