Гамма против логнормальных распределений


29

У меня есть экспериментально наблюдаемое распределение, которое выглядит очень похожим на гамма или логнормальное распределение. Я читал, что логнормальное распределение - это максимальное распределение вероятности энтропии для случайной переменной для которой среднее значение и дисперсия являются фиксированными. Обладает ли гамма-распределение подобными свойствами?Xln(X)


2
Почему такое свойство будет иметь какую-то ценность при принятии решения, какая модель будет подходящей?
Glen_b

@Glen_b Я все еще начинающий, когда дело доходит до статистики, поэтому мои знания довольно просты. Глядя на графики гамма- и логнормальных распределений, качественно они выглядят очень похоже. Я ищу количественные различия между ними. Например, каковы некоторые примеры физических приложений, где происходят гамма или логнормальные распределения?
OSE

В действительности, вероятно, никогда не происходит; это чрезвычайно простые модели, которые иногда полезны (если грубо) приближают реальность. Я опубликую ответ, в котором обсуждаются некоторые качественные различия.
Glen_b

1
@glen_b: причина в том, что если вы измеряете только эти статистические данные, то минимальное предполагаемое распределение является уникальным экспоненциальным распределением семейства с этими достаточными статистическими данными. В то время как любое распределение может быть плохой моделью реальности, если вы не можете свободно выбирать, какие измерения проводить, то это отличный способ выбора модели.
Нил Г

1
@Glen_b Я думаю, что в некоторых физических ситуациях логнормальное распределение должно появляться из-за CLT.
Стефан Лоран

Ответы:


27

Что касается качественных различий, то логнормальная и гамма, как вы говорите, довольно похожи.

Действительно, на практике они часто используются для моделирования одних и тех же явлений (некоторые люди используют гамму, тогда как другие используют логнормальные значения). Обе они, например, являются моделями с постоянным коэффициентом вариации (CV для логнормального значения - , для гаммы - ).eσ211/α

[Как это может быть постоянным, если это зависит от параметра, спросите вы? Это применимо, когда вы моделируете масштаб (местоположение для масштаба журнала); для логнормального значения действует как параметр масштаба, в то время как для гаммы масштаб является параметром, который не является параметром формы (или его обратным значением, если вы используете параметризацию скорости формы). Я назову параметр масштаба для гамма-распределения . Гамма-GLM моделируют среднее значение ( ), сохраняя постоянным; в этом случае также является параметром масштаба. Модель с переменной и константой или соответственно будет иметь постоянную CV.]μβμ=αβαμμασ

Возможно, вам будет полезно посмотреть на плотность их журналов , что часто показывает очень четкую разницу.

Журнал логнормальной случайной величины ... нормальный. Это симметрично.

Лог гамма-случайной величины является левосторонним. В зависимости от значения параметра shape, он может быть довольно наклонным или почти симметричным.

Вот пример, где и логнормальное, и гамма имеют среднее значение 1 и дисперсию 1/4. На верхнем графике показаны плотности (гамма зеленым, логарифмическая синего цвета), а на нижнем - плотности каротажных:

гамма и логнормаль, денситий и плотность бревна

(Построение логарифма плотности журналов также полезно. То есть берется логарифмическая шкала на оси Y выше)

Это различие подразумевает, что гамма имеет больше хвоста слева и меньше хвоста справа; дальний правый хвост бревна тяжелее, а левый хвост светлее. И действительно, если вы посмотрите на асимметрию логнормального и гамма-значений для заданного коэффициента вариации, логнормальное отклонение будет более правильным ( ), чем гамма ( ).CV3+3CV2CV


+1. Знаете ли вы, есть ли закрытая формула для асимметрии каротажа гаммы? Для логнормального асимметрия логарифма явно равна нулю, и мне интересно, есть ли какое-нибудь выражение для гаммы. В Википедии приведены формулы для среднего значения и дисперсии log (гамма), но не для асимметрии.
говорит амеба: восстанови Монику

Градштейн и Рыжик (раздел 4.358, 7-е изд.) Перечисляют явные закрытые формы для для то время как случай сделан в 4.352 (при условии, что вы рассматриваете выражения в функциях и как замкнутую форму) - из которого он определенно выполним до эксцесса; они дают интеграл для всех как производную гамма-функции, так что, вероятно, можно пойти выше. Таким образом, асимметрия, конечно, выполнима, но не особенно "аккуратна". Если вы хотите продолжить это, я мог бы дать вам интегралы. 0xν1eμx(lnx)pdxp=2,3,4p=1Γ,ψζp
Glen_b

Однако нам не нужно оценивать асимметрию, чтобы различить ее знак. Изучения журнала плотности журналов должно быть достаточно, чтобы установить это, потому что одна сторона явно доминирует над другой.
Glen_b

Спасибо Глен. Я решил опубликовать его как новый вопрос: stats.stackexchange.com/questions/312803 . Я потратил некоторое время на поиск готового ответа, но не смог найти ни одного, поэтому в будущем было бы полезно записать его где-нибудь, где его легко найти. Это может быть несколько лучше подходит для Math.SE, но я бы предпочел иметь его здесь, если честно.
говорит амеба, восстанови Монику

11

Да, гамма-распределение является максимальным энтропийным распределением, для которого фиксированное значение и среднее-log . Как и во всех экспоненциальных семейных распределениях, это уникальное максимальное распределение энтропии для фиксированной ожидаемой достаточной статистики.E(X)E(logX)

Чтобы ответить на ваш вопрос о физических процессах, которые генерируют эти распределения: Логнормальное распределение возникает, когда логарифм X обычно распределяется, например, если X является продуктом очень многих небольших факторов. Если X имеет гамма-распределение, то это сумма многих экспоненциально распределенных переменных. Например, время ожидания для многих событий пуассоновского процесса.


5
Не нужно "много" экспоненциальных вариаций, чтобы быть Гаммой.
Стефан Лоран
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.