Пример распределения с тяжелым хвостом, которое не является длиннохвостым


14

Из прочтений о тяжелых и длиннохвостых дистрибутивах я понял, что все длиннохвостые дистрибутивы имеют «большой хвост» , но не все дистрибутивы с «длинным хвостом» имеют длинный хвост .

Может ли кто-нибудь привести пример:

  • непрерывная симметричная функция плотности с нулевым средним, длиннохвостая
  • непрерывная, симметричная, функция с нулевой средней плотностью, с тяжелыми хвостами, но не с длинными хвостами

чтобы я мог лучше понять смысл их определений?

Было бы еще лучше, если бы оба могли иметь единичную дисперсию.


2
Где вы нашли эти определения? Можете ли вы дать им здесь? Я думал об этом как синонимы!
kjetil b halvorsen

@kjetilbhalvorsen: Возможно здесь: en.wikipedia.org/wiki/…
Scortchi - Восстановить Монику

@kjetilbhalvorsen SA: См. ссылку E. LA: Я изучал определения «тяжелых», «толстых» и «длиннохвостых» дистрибутивов и нашел полезные объяснения по адресу: (A) [ stats.stackexchange.com/ Вопросы / 10726 /… , (B) [ en.wikipedia.org/wiki/Heavy-tailed_distribution] , (C) [ users.cms.caltech.edu/~adamw/papers/… , (продолжение)
toliveira

(продолжение) (E) math.stackexchange.com/questions/685921/… Я понял, что (i) распределение с тяжелыми хвостами определяется как в A, B, C, D, E, (ii) определяется распределение с длинными хвостами как и в B, C, E (iii) определение «толстохвостый» является свободным, как объяснено в A.
toliveira

Ответы:


16

Два определения близки, но не совсем одинаковы. Одно из различий заключается в необходимости ограничения выживаемости.

Для большей части этого ответа я буду игнорировать критерии для распределения, чтобы быть непрерывным, симметричным и конечной дисперсии, потому что их легко выполнить, как только мы нашли любое распределение с тяжелыми хвостами конечной дисперсии, которое не является длиннохвостым.


Распределение является тяжелым хвостом , когда для любого т > 0 ,Ft>0

(1)RetxdF(x)=.

Распределение с функцией выживания является длиннохвостым, когдаGF=1F

(2)limxGF(x+1)GF(x)=1.

Длиннохвостые распределения тяжелы. Кроме того, поскольку не возрастает, предел отношения ( 2 ) не может превышать 1 . Если он существует и меньше 1 , то G экспоненциально убывает - и это позволит интегралу ( 1 ) сходиться.G(2)11G(1)

Единственный способ показать распределение с длинными хвостами, которое не является длиннохвостым, состоит в том, чтобы изменить распределение с длинными хвостами так, чтобы продолжал удерживаться, в то время как ( 2 ) нарушается. Ограничить предел легко: измените его в бесконечном количестве мест, которые расходятся до бесконечности. Это займет некоторое время с F , который должен оставаться увеличивающимся и cadlag. Одним из способов является введение некоторых скачков вверх в F , что заставит G перескакивать вниз, уменьшая отношение G F ( x + 1 ) / G F ( x )(1)(2)FFGGF(x+1)/GF(x), Для этого давайте определим преобразование которое превращает F в другую действительную функцию распределения, одновременно создавая внезапный скачок значения u , скажем, переход на полпути от F ( u ) к 1 :TuFuF(u)1

Tu[F](x)={F(x)u<x12(1F(x))+F(x)ux

Это не меняет базового свойства : T u [ F ] все еще является функцией распределения.FTu[F]

Влияние на , чтобы сделать его падение с коэффициентом 1 / 2 при ц . Следовательно, поскольку G неубывающая, то всякий раз, когда u - 1 x < u ,GF1/2uGu1x<u

GTu[F](x+1)GTu[F](x)12.

Если мы выберем возрастающую и расходящуюся последовательность , i = 1 , 2 , и применим каждый T u i по очереди, это определит последовательность распределений F i с F 0 = F иuii=1,2,TuiFiF0=F

Fi+1=Tui[Fi]

для . После i- го шага F i ( x ) , F i + 1 ( x ) , все остаются теми же для x < u i . Следовательно, последовательность F i ( x ) является неубывающей, ограниченной, поточечной последовательностью функций распределения, подразумевающей ее пределi1ithFi(x),Fi+1(x),x<uiFi(x)

F=limiFi

является функцией распределения. По конструкции это не длинный хвост , потому что существует бесконечное множество точек , в которых его коэффициент выживаемости падает до 1 / 2 или ниже, показывает , что не может быть 1 , как предел.GF(x+1)/GF(x))1/21

Figure 1: An altered survival function

Этот график показывает , функция выживаемости , который был сокращен таким образом , в точках U 112,9 , U 240,5 , у 3101.6 , ... . Обратите внимание на логарифмическую вертикальную ось.G(x)=x1/5u112.9,u240.5,u3101.6,.

Надежда состоит в том, чтобы иметь возможность выбрать так, чтобы F оставался тяжелым хвостом. Мы знаем, потому что F с тяжелым хвостом, что есть числа 0 = u 0 < u 1 < u 2 < < u n ⋯, для которых(ui)FF0=u0<u1<u2<<un

ui1uiex/idF(x)2i1

for every i1. The reason for the 2i1 on the right is that the probabilities assigned by F to values up to ui have been successively cut in half i1 times. That procedure, when dF(x) is replaced by dFj(x) for any ji, will reduce 2i1 to 1, but no lower.

Figure 2: A cut-down density function

Это график для плотностей f, соответствующих предыдущей функции выживания и ее «урезанной» версии. Области под этой кривой способствуют ожиданию. Площадь от 1 до U 1 представляет 1 ; площадь от u 1 до u 2 равна 2 , которая при срезании (до нижней синей части) становится площадью 1 ; площадь от u 2 до u 3 равна 4 , которая при срезании становится площадью 1xf(x)f1u11u1u221u2u341, and so on. Thus, the area under each successive "stair step" to the right is 1.

Let us pick such a sequence (ui) to define F. We can check that it remains heavy-tailed by picking t=1/n for some whole number n and applying the construction:

RetxdF(x)=Rex/ndF(x)=i=1ui1uiex/ndF(x)i=n+1ui1uiex/ndF(x)i=n+1ui1uiex/idF(x)=i=n+1ui1uiex/idFi(x)i=n+11,

which still diverges. Since t is arbitrarily small, this demonstrates that F remains heavy-tailed, even though its long-tailed property has been destroyed.

Figure 3: plot of G(1+x)/G(x)

This is a plot of the survival ratio G(x+1)/G(x) for the cut down distribution. Like the ratio of the original G, it tends toward an upper accumulation value of 1--but for unit-width intervals terminating at the ui, the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as x increases, occur infinitely often and therefore prevent the ratio from approaching 1 in the limit.


If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. F(x)=1xp (for x>0) will do, provided p>1; so would a Student t distribution for any degrees of freedom exceeding 2. The moments of F cannot exceed those of F, whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call F--by defining

Fs(x)=12(1+sgn(x)F(|x|))

for all xR. Its variance will remain finite, so it can be standardized to the desired distribution.


2
Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.
toliveira
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.