Гамма имеет свойство, разделяемое логнормальным; а именно, когда параметр формы поддерживается постоянным, а параметр масштаба изменяется (как это обычно делается при использовании любой из моделей), дисперсия пропорциональна среднеквадратическому (постоянный коэффициент вариации).
Нечто приближенное к этому происходит довольно часто с финансовыми данными или даже со многими другими типами данных.
В результате он часто подходит для данных, которые являются непрерывными, положительными, смещенными вправо и где дисперсия почти постоянна в логарифмическом масштабе, хотя есть ряд других хорошо известных (и часто довольно легко доступных) вариантов с этими свойства.
Кроме того, обычно используется лог-линк с гамма-GLM (реже использовать натуральную ссылку относительно редко). Что немного отличает его от подгонки нормальной линейной модели к логам данных, так это то, что в логарифмическом масштабе гамма остается наклоненной в разной степени, в то время как нормаль (лог логнормального) симметрична. Это делает его (гамма) полезным в различных ситуациях.
Я видел практическое применение гамма-ГЛМ, обсуждаемое (с примерами реальных данных) в (вне пределов моей головы) « Де Йонг и Хеллер и Фриес», а также в многочисленных работах; Я также видел приложения в других областях. О, и если я правильно помню, Venables и MASS Рипли используют его для школьных прогулок (данные квин.; Edit: оказывается, это на самом деле в дополнениях статистики к MASS , см. Стр. 11, 14-я страница pdf, там есть ссылка на журнал, но есть небольшое смещение DV). Э-э, а МакКаллах и Нелдер сделали пример свертывания крови, хотя, возможно, это было естественным связующим звеном.
Тогда есть книга Faraway, где он сделал пример страхования автомобиля и пример данных о производстве полупроводников.
Есть некоторые преимущества и недостатки при выборе любого из двух вариантов. С этих дней оба легко приспосабливаются; Обычно это вопрос выбора наиболее подходящего.
Это далеко не единственный вариант; например, существуют также обратные гауссовы GLM, которые являются более косо / более тяжелыми (и даже более гетероскедастичными), чем гамма или логнормальные.
Что касается недостатков, то делать интервалы прогнозирования сложнее. Некоторые диагностические дисплеи труднее интерпретировать. Вычисление ожиданий по шкале линейного предиктора (обычно логарифмической шкалы) сложнее, чем для эквивалентной логнормальной модели. Тесты гипотез и интервалы, как правило, асимптотические. Это часто относительно незначительные проблемы.
Он имеет некоторые преимущества по сравнению с логнормальной регрессией логарифмических связей (взятие логов и подбор обычной модели линейной регрессии); во-первых, среднее предсказание легко.