Всегда ли среднее значение одномерной случайной величины равно интегралу ее квантильной функции?


17

Я только что заметил, что интеграция квантовой функции одномерной случайной величины (обратной cdf) от p = 0 до p = 1 дает среднее значение переменной. Я не слышал об этих отношениях до сих пор, поэтому мне интересно: это всегда так? Если так, широко ли известны эти отношения?

Вот пример в Python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

Ответы:


26

Пусть F будет CDF случайной величины X , поэтому обратный CDF может быть записан как F1 . В вашем интеграле сделайте замену p=F(x) , dp=F(x)dx=f(x)dx чтобы получить

01F1(p)dp=xf(x)dx=EF[X].

Это справедливо для непрерывных распределений. Необходимо соблюдать осторожность для других распределений, потому что обратный CDF не имеет уникального определения.

редактировать

Когда переменная не является непрерывной, она не имеет распределения, которое является абсолютно непрерывным относительно меры Лебега, что требует осторожности в определении обратного CDF и осторожности в вычислении интегралов. Рассмотрим, например, случай дискретного распределения. По определению, это тот, чей CDF F является шаговой функцией с шагами размера PrF(x) при каждом возможном значении x .

фигура 1

На этом рисунке показана CDF из Бернулли (2/3) распределение масштабируется . То есть случайная величина имеет вероятность равную и вероятность равную . Высоты прыжков в и дают их вероятности. Ожидание этой переменной, очевидно, равно .21/302/32020×(1/3)+2×(2/3)=4/3

Мы могли бы определить «обратный CDF» , требуяF1

F1(p)=x if F(x)p and F(x)<p.

Это означает, что также является шаговой функцией. Для любого возможного значения случайной величины будет достигать значения на интервале длины . Поэтому его интеграл получается суммированием значений , что является только ожиданием.F1xF1xPrF(x)xPrF(x)

фигура 2

Это график обратного CDF предыдущего примера. Скачки и в CDF становятся горизонтальными линиями этих длин на высотах, равных и , значениям, вероятностям которых они соответствуют. (Обратный CDF не определен за пределами интервала .) Его интеграл представляет собой сумму двух прямоугольников, один из которых имеет высоту и основание , а другой - высоту и основание , всего , как и раньше.1/32/302[0,1]01/322/34/3

В общем, для смеси непрерывного и дискретного распределения нам нужно определить обратный CDF, чтобы параллельна этой конструкции: при каждом дискретном скачке высоты мы должны формировать горизонтальную линию длины как определено в предыдущей формуле.pp


Вы сделали ошибку в изменении переменной. откуда взялся х?
Маскарпоне

3
@Mascarpone Пожалуйста, прочитайте текст, предшествующий уравнению. Я не думаю, что есть ошибка в изменении переменной :-), но если вы думаете, что это прояснит изложение, я был бы рад указать, что когда , то . Я просто не думал, что это было необходимо. p=F(x)x=F1(p)
whuber

теперь я получил это;),
Mascarpone

+1 Уубер: Спасибо! Не могли бы вы уточнить, чтобы использовать приведенную вами формулу, как позаботиться о других дистрибутивах, обратный CDF которых не имеет уникального определения?
StackExchange для всех

1
Чтобы обойти такие непростые соображения об инверсиях, псевдообращениях и т. П. И одновременно обобщения на каждый момент, см. Здесь .
Сделал

9

Эквивалентный результат хорошо известен в анализе выживаемости : ожидаемое время жизни где функция выживания S ( t ) = Pr ( T > t ), измеренная с рождения при t = 0 . (Его можно легко расширить, чтобы охватить отрицательные значения t .)

t=0S(t)dt
S(t)=Pr(T>t)t=0t

enter image description here

Таким образом, мы можем переписать это как но это1 q = 0 F - 1 ( q )

t=0(1F(t))dt
как показано в различных отражениях рассматриваемой области
q=01F1(q)dq

enter image description here


1
Мне нравятся картинки, и я инстинктивно чувствую, что здесь таится отличная идея - мне нравится эта идея - но я не понимаю эти конкретные. Пояснения были бы полезны. Одна вещь, которая останавливает меня в моих следах, - это мысль о попытке расширить интеграл от до - : он должен расходиться. (1F(t))dt
whuber

@whuber: если вы хотите расширить до отрицательного , вы получите t = 0 ( 1 - F ( t ) )t . Обратите внимание, что если это сходится для распределения, симметричного относительно 0 , то есть F ( t ) = 1 - F ( - t ), то легко увидеть, что ожидание равно нулю. Взятие суммы, а не разностиt = 0 ( 1 - F ( t ) )t=0(1F(t))dtt=0F(t)dt0F(t)=1F(t) дает среднее абсолютное отклонение около 0 . t=0(1F(t))dt+t=0F(t)dt0
Генри

Если вам нравятся диаграммы, вас может заинтересовать статья 1988 года Ли: «Математика превышения покрытия убытков и ретроспективного графического подхода к рейтингу-А» .
Авраам

4

Мы оцениваем:

enter image description here

Давайте попробуем с простой заменой переменной:

enter image description here

И мы замечаем, что по определению PDF и CDF:

enter image description here

почти всюду. Таким образом, мы имеем по определению ожидаемое значение:

enter image description here


В последней строке я объясню более четко определение ожидаемой стоимости. Почти везде относится к уравнению выше последнего. ru.wikipedia.org/wiki/Almost_everywhere
Маскарпоне

1
Отредактировано, спасибо :)
Mascarpone

3

Для любой вещественной случайной величины с cdf F хорошо известно, что F - 1 ( U ) имеет тот же закон, что и X, когда U равномерно по ( 0 , 1 ) . Следовательно, ожидание X , когда оно существует, совпадает с ожиданием F - 1 ( U ) : E ( X ) = E ( F - 1 ( U ) ) =XF F1(U)XU(0,1)XF1(U)

E(X)=E(F1(U))=01F1(u)du.
XF1(U)FF1FF

1

F(x)P(Xx)F1

F1(p)=min(x|F(x)p).
minU[0,1]. You can easily verify that F1(U) has the same CDF as X, which is F. This doesn't require X to be continuous. Hence, E(X)=E(F1(U))=01F1(p)dp. The integral is the Riemann–Stieltjes integral. The only assumption we need is the mean of X exists (E|X|<).

That's the same answer as mine.
Stéphane Laurent
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.