Сумма независимых логнормальных случайных величин оказывается логнормальной?


11

Я пытаюсь понять, почему сумма двух (или более) логнормальных случайных величин приближается к логнормальному распределению при увеличении количества наблюдений. Я посмотрел онлайн и не нашел никаких результатов, касающихся этого.

Ясно, что если и Y являются независимыми логнормальными переменными, то по свойствам экспонент и гауссовских случайных величин X \ times Y также логнормально. Однако нет никаких оснований предполагать, что X + Y также является логнормальным.Y X × Y X + YXYX×YX+Y

ОДНАКО

Если вы генерируете две независимые логнормальные случайные величины X и Y , и пусть Z=X+Y , и повторяете этот процесс много раз, распределение Z выглядит логнормальным. Кажется, что оно даже приближается к логнормальному распределению при увеличении количества наблюдений.

Например: после генерации 1 миллиона пар распределение натурального логарифма Z приведено в гистограмме ниже. Это очень ясно напоминает нормальное распределение, предполагая, что Z действительно логнормален.

введите описание изображения здесь

Есть ли у кого-нибудь понимание или ссылки на тексты, которые могут быть полезны для понимания этого?


Вы предполагаете равные отклонения для и ? Если вы симулируете , то журнал суммы уже не выглядит нормально. YXYxx <- rlnorm(1e6,0,3); yy <- rlnorm(1e6,0,1)
Стефан Коласса

Я допускал равные отклонения - попробую другой с неравным отклонением и посмотрю, чем я в итоге.
Пэтти

С отклонениями 2 и 3 я получил что-то, что все еще выглядело немного нормальным, альбийским с тем, что выглядит как крошечный крошечный перекос.
Пэтти

1
Просмотр предыдущих вопросов может быть полезным. Здесь и здесь потенциально полезные документы. Хорошо выглядишь!
Стефан Коласса

Ответы:


20

Эта приблизительная логнормальность сумм логнормалей является известным эмпирическим правилом; это упоминается во многих статьях - и в ряде публикаций на сайте.

Логнормальное приближение для суммы логнормальных чисел путем сопоставления первых двух моментов иногда называют приближением Фентона-Уилкинсона.

Вы можете найти этот документ Dufresne полезным (доступно здесь или здесь ).

Я также в прошлом иногда указывал людям на статью Митчелла

Митчелл Р.Л. (1968),
«Постоянство логнормального распределения».
J. Оптическое общество Америки . 58: 1267-1272.

Но это теперь покрыто ссылками Dufresne.

Но несмотря на то, что он выполняется в довольно широком наборе не слишком искаженных случаев, он не выполняется вообще, даже для логарифмов iid, даже если становится достаточно большим.n

Вот гистограмма из 1000 смоделированных значений, каждое из которых представляет собой сумму пятидесяти тысяч логарифмов iid:

гистограмма суммы пятидесяти тысяч логнормалей

Как видите ... лог довольно искажен, поэтому сумма не очень близка к логнормальной.

В самом деле, этот пример также считается полезным примером для людей, думающих (из-за центральной теоремы о пределе), что некоторые из сотен или тысяч дадут очень близкие к нормальным средним значениям; эта кривая настолько наклонена, что ее логарифм значительно наклонен вправо, но здесь применима центральная предельная теорема; многомиллионных * будет необходим , прежде чем он начинает искать где - нибудь рядом с симметричным.nнn

* Я не пытался выяснить, сколько, но из-за того, как ведет себя асимметрия сумм (эквивалентно средним), нескольких миллионов явно будет недостаточно


Поскольку в комментариях было запрошено больше деталей, вы можете получить результат, похожий на пример со следующим кодом, который создает 1000 повторов из суммы 50000 логнормальных случайных величин с параметром масштаба и параметром формы :μ=0σ=4

res <- replicate(1000,sum(rlnorm(50000,0,4)))
hist(log(res),n=100)

(С тех пор я пробовал Его журнал все еще сильно искажен)n=106


Не могли бы вы добавить параметры (или фрагмент кода), используемые для создания гистограммы на рисунке?
Altroware

1
Это было два года назад, я не помню, какие были логнормальные параметры. Но давайте применим простую логику. Вам не нужно беспокоиться о параметре , поскольку он влияет только на значения по оси x, а не на форму (будет использоваться что-то удобное, например ). Таким образом, параметр остается единственным параметром, влияющим на форму. Предполагая и возвращаясь примерно к шкале на гистограмме выше, мы получаем, что должно быть в пределах или около того (NB, остерегайтесь того, как это искажено). И просто попытка дает довольно похожий вид на вышеприведенный. μ = 0 σ μ = 0 σ 4 4μμ=0σμ=0σ44
Glen_b

1
Итак: res <- replicate(1000,sum(rlnorm(50000,0,4))); hist(log(res),n=100)... если вы попробуете это несколько раз, вы увидите, что весы немного скачут, но общая картина примерно правильная. Обратите внимание, что асимметрия моментов населения для логнормальных составляющих составляет млрд. - в большинстве ваших выборок среднее значение будет превышать почти каждое сгенерированное значение. 26.5
Glen_b

2

Возможно, уже слишком поздно, но я нашел следующую статью о суммах логнормальных распределений , которая охватывает эту тему. Это не логично, а нечто совершенно иное, с которым трудно работать.


1

Рекомендованная статья Dufresne 2009 года и эта статья 2004 года вместе с этой полезной статьей охватывают историю аппроксимаций суммы логнормального распределения и дают сумму математических результатов.

μσ

Может быть, [этот документ] ( http://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=6029348 ) даст вам в каком-то конкретном случае своего рода центральную предельную теорему для суммы логнормальных норм, но все еще существует отсутствие общности. В любом случае, приведенный Glen_b пример не совсем уместен, потому что это тот случай, когда вы можете легко применить классическую центральную предельную теорему, и, конечно, в этом случае сумма логнормальных норм равна гауссовой.

N


1
Вы говорите, что в моем примере «вы можете легко применить классическую центральную предельную теорему», но если вы понимаете, что показывает гистограмма, вы явно не сможете использовать CLT, чтобы утверждать, что для этого случая применяется нормальное приближение при n = 50000; сумма настолько искажена, что ее бревно все еще сильно искажено. Суть примера в том, что он даже слишком асимметричен для аппроксимации логнормальным (или что гистограмма будет выглядеть очень близко к симметричной). Менее асимметричное приближение (например, нормальное) было бы * хуже * /
Glen_b

Я согласен, но, вероятно, в вашем примере либо числовая сходимость выборки не достигнута (1000 испытаний слишком мало), либо статистическая конвергенция не достигнута (50 000 добавок слишком мало), но для предела бесконечности распределение должно быть гауссовским, так как мы находимся в условиях CLT, не так ли?
Мими

1000 выборок более чем достаточно для определения формы распределения суммы - количество выборок, которые мы берем, не меняет форму, а то, насколько «ясно» мы ее видим. Эта чистая асимметрия не исчезнет, ​​если мы возьмем более крупную выборку, она будет выглядеть более гладкой. Да, 50000 - это слишком мало, чтобы сумма выглядела нормально - это настолько правильно, что журнал все еще выглядит очень искаженным. Это может потребовать многих миллионов, прежде чем это будет выглядеть нормально. Да, CLT определенно применяется; это iid и дисперсия конечна, поэтому стандартизированные средства должны в конечном итоге приблизиться к нормальности.
Glen_b

1

Логнормальный закон широко присутствует в физических явлениях, суммы таких распределений необходимы, например, для изучения любого масштабирующего поведения системы. Я знаю эту статью (очень длинную и очень сильную, начало можно понять, если вы не специалист!), "Эффекты широкого распределения в суммах логнормальных случайных величин", опубликованные в 2003 году (Европейский физический журнал B-Condensed Matter and Complex Системы 32, 513) и доступен https://arxiv.org/pdf/physics/0211065.pdf .

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.