Параметрическое моделирование дисперсии данных счета


12

Я хочу смоделировать некоторые данные, но я не уверен, какой тип модели я могу использовать. У меня есть данные подсчета, и я хочу модель, которая даст параметрические оценки как среднего значения, так и дисперсии данных. То есть у меня есть различные прогностические факторы, и я хочу определить, влияет ли какой-либо из них на дисперсию (а не только на среднее по группе).

Я знаю, что регрессия Пуассона не будет работать, потому что дисперсия равна среднему значению; в моем случае это предположение недопустимо, поэтому я знаю, что существует чрезмерная дисперсия. Однако отрицательная биномиальная модель генерирует только один параметр избыточной дисперсии, а не тот, который является функцией предикторов в модели. Какая модель может сделать это?

Кроме того, ссылка на книгу или документ, который обсуждает модель и / или пакет R, который реализует модель, будет принята с благодарностью.


1
Откуда вы знаете, что существует чрезмерная дисперсия без предварительной регрессии Пуассона? В конце концов, сравнение дисперсии необработанных (ответных) значений с их средним значением не имеет значения: важна достоверность соответствия модели Пуассона (это аналог оценки распределения невязок в линейной модели по сравнению с оценкой распределение переменной ответа). Другой способ выразить это заключается в том, что связь между независимыми переменными и откликом может создать видимость избыточной дисперсии даже в прекрасно точной модели Пуассона.
whuber

2
@ Whuber Это справедливо. Для одного категориального предиктора, наблюдающего дисперсию и среднее значение подгрупп, было бы достаточно, чтобы обнаружить избыточную дисперсию, но для многомерной регрессии Пуассона это не так. В качестве аргумента давайте предположим, что и пуассоновская, и отрицательная регрессия бинома были выполнены, а отрицательный биномиал показывает лучшее соответствие с помощью сравнения модели ановы. Это должно указывать на чрезмерную дисперсию. Учитывая это, как дисперсия / сверхдисперсия может быть смоделирована параметрически, а не как константа?
Брайан Диггс

1
Я думаю, что есть глава в МакКаллахе и Нелдере, Обобщенные линейные модели, 2-е издание , которая покрывает это (но моя копия в работе) ... реальной вероятности не будет, но вы можете использовать квази-правдоподобие и так, чтобы может быть название главы. Вы применяете итеративно взвешенные наименьшие квадраты, даже если нет соответствующей модели вероятности.
Карл

Глава 10 McCullagh и Nelder обсуждает совместное моделирование среднего значения и дисперсии, то есть параметризацию как среднего значения, так и дисперсии. Расширенный квази-правдоподобие является основным инструментом, но в некоторых ситуациях могут возникнуть проблемы с этим методом
гость

Ответы:


9

Вы можете смоделировать сам параметр отрицательной биномиальной дисперсии как функцию переменных и параметров, используя пакет gamlss в R. Я приведу выдержку из введения в него:

Почему я должен использовать GAMLSS

Если ваша переменная ответа представляет собой подсчетные (дискретные) данные, очень вероятно, что распределение Пуассона не будет подходящим. GAMLSS предоставляет множество дискретных распределений (включая отрицательный бином), которые вы можете попробовать. Параметр дисперсии также может быть смоделирован как функция объясняющих переменных.

На сайте www.gamlss.org есть документация и ссылки на несколько статей о подходах, использованных в пакете.


Оба ответа полезны и дают хорошие ссылки. Я присуждаю награду этой, потому что (а) она предшествовала другой на четыре минуты, и (б) решение gamlss является новым для меня (я знаком с nbreg). Но снимаю шляпу перед @timbp за хороший ответ; Я надеюсь, что вы продолжите вносить свой вклад в наш сайт.
whuber

2
@whuber, меня также разрывало то, что принять как «ответ», потому что оба были очень полезны. Я пошел с этим, потому что он включал ссылку на пакет R, который я могу использовать; ссылка на книгу в другом ответе была хорошим чтением и не должна сбрасываться со счетов. Спасибо за предложение награды за эти два хороших ответа.
Брайан Диггс

9

Stata предоставляет команду -gnbreg-, которая позволяет моделировать параметр дисперсии. Вы можете просмотреть справку Stata для команды на http://www.stata.com/help.cgi?nbreg

Стата называет это обобщенной отрицательной биномиальной моделью. Джозеф Хилбе обсуждает это в своей книге «Отрицательная биноминальная регрессия», раздел 10.4, как «NB-H: гетерогенная отрицательная биноминальная регрессия».

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.