Как рассчитать функцию плотности вероятности максимума выборки равномерных случайных величин IID?


45

Учитывая случайную величину

Y=max(X1,X2,,Xn)

где Xi - однородные переменные IID, как рассчитать PDF для Y ?


4
Если это домашняя работа, пожалуйста, прочитайте FAQ и обновите свой вопрос соответственно.
кардинал

Можно ли использовать личность Вандермонда, чтобы показать совместную функцию статистики 2 порядка, скажем, F_y (r) * G_y (r)?
Ларри Минц

Из курса, какой курс покрывает такого рода проблемы? Это не то, с чем я столкнулся в моем курсе вероятности разработки.
Алекс

@ Алекс Как насчет статистического курса, который охватывает повторную выборку?
SOFe

Ответы:


65

Возможно, этот вопрос - домашнее задание, но я чувствовал, что этот классический элементарный вопрос о вероятности все еще не получил полного ответа через несколько месяцев, поэтому я дам его здесь.

Из постановки задачи мы хотим, чтобы распределение

Y=max{X1,...,Xn}

где - это iid . Мы знаем, что тогда и только тогда, когда каждый элемент выборки меньше . Тогда это, как указано в подсказке @ varty, в сочетании с тем фактом, что независимы, позволяет нам сделать выводX1,...,XnUniform(a,b)Y<xxXi

P(Yx)=P(X1x,...,Xnx)=i=1nP(Xix)=FX(x)n

где - CDF равномерного распределения . Следовательно, CDF для имеет вид FX(x)Y

FY(y)=P(Yy)={0ya[(ya)/(ba)]ny(a,b)1yb

Поскольку имеет абсолютно непрерывное распределение, мы можем вывести его плотность, дифференцируя CDF . Поэтому плотность являетсяYY

pY(y)=n(ya)n1(ba)n

В частном случае, когда , мы имеем , то есть плотность распределения бета с и , поскольку .a=0,b=1pY(y)=nyn1α=nβ=1Beta(n,1)=Γ(n+1)Γ(n)Γ(1)=n!(n1)!=n

Как примечание, последовательность, которую вы получаете, если сортируете свою выборку в возрастающем порядке - - называется статистикой заказа . Обобщение этого ответа состоит в том, что все статистические данные порядка распределенной выборки имеют бета-распределение , как отмечено в ответе @ bnaul. X(1),...,X(n)Uniform(0,1)


Это на самом деле был домашний вопрос для меня. Спасибо за объяснение.
Пол вечера

Я чувствую, что должен быть в состоянии принять ваши идеи здесь и ответить на этот вопрос , но я не вижу, как это сделать. Можете ли вы помочь мне? Можете ли вы порекомендовать учебник или главу, посвященную этой общей проблеме?

@PaulPM Из интереса, какой курс покрывает такую ​​проблему? Это не то, с чем я столкнулся в моем курсе вероятности разработки.
Алекс

6

Максимум выборки - это одна из статистики порядка , в частности статистика го порядка выборки . В общем, вычисление распределения статистики заказов затруднено, как описано в статье в Википедии; для некоторых специальных распределений статистика порядка хорошо известна (например, для равномерного распределения, которое имеет бета-распределенную статистику порядка).nX1,,Xn

РЕДАКТИРОВАТЬ: статья в Википедии о максимуме и минимуме образца также полезна и более специфична для вашей проблемы.


5
Для распределений с плотностями вычисление предельного распределения статистики определенного порядка довольно просто. Это даже проще для «особой» статистики заказов, как минимум и максимум.
кардинал

Я думаю, это зависит от того, что подразумевается под «вычислить» в исходном вопросе. Конечно, делать это численно просто; Я интерпретировал этот вопрос как вопрос о том, как найти решение в закрытой форме, что в общем случае нелегко.
bnaul

8
@bnaul: Пусть быть произвольной функции распределения и пусть быть IID выборка из . Пусть будет статистикой го порядка. ТогдаКЕД . F(x)=P(Xx)X1,,XnFX(k)k
P(X(k)x)=m=knP(|{i:Xix}|=m)=m=kn(nm)F(x)m(1F(x))nm.
кардинал

1
Возможно, способ понять ответ кардиналов (учитывая, что вы понимаете статистику порядка для униформ) состоит в том, что, поскольку cdfs являются монотонными преобразованиями 1-в-1 унифицированного cdf, мы всегда можем выразить событие {X <a} в терминах униформы случайная величина (вот почему работает Монте-Карло). Таким образом, любой результат, основанный на равномерном распределении, легко обобщается на другие случайные переменные - просто примените преобразование . U=FX(X)
вероятностная

2
@probabilityislogic: Интуиция хорошая, хотя кажется, что в вашем комментарии есть постоянные случайные переменные. (Результат в моем втором комментарии выше, например, работает для произвольной функции распределения.)
Кардинал

1

Если является CDF для , то Затем можно использовать свойство iid и cdf унифицированной переменной для вычисления .FY(y)Y

FY(y)=Prob(y>X1,y>X2,...,y>Xn)
FY(y)

-3

Максимум набора случайных величин IID при соответствующей нормализации обычно сходится к одному из трех типов экстремальных значений. Это теорема Гнеденко, эквивалентность центральной предельной теоремы для крайностей. Конкретный тип зависит от поведения хвоста распределения популяции. Зная это, вы можете использовать предельное распределение, чтобы приблизить распределение к максимуму.

Поскольку равномерное распределение на [a, b] является предметом этого вопроса, Макро дал точное распределение для любого n и очень хороший ответ. Результат довольно тривиальный. Для нормального распределения хорошая замкнутая форма невозможна, но соответственно нормализованный максимум для нормального сходится к распределению Гумбеля F (x) = exp (- e ).x

Для униформы нормализация равна (ba) -x / n и F (bax / n) = (1-x / [n (ba)])nn

которая сходится к е . Обратите внимание, что y = bax / n. и F (y) сходится к 1, когда y переходит к ba. Это верно для всех 0 x/(ba)n

В этом случае легко сравнить точное значение с его асимптотическим пределом.

Книга Гамбеля

Книга Галамбоса

Книга Лидбеттера

Книга Новака

Книга Коулз


4
Чтобы этот ответ был практически осуществимым, вам необходимо подробно указать, как «надлежащим образом нормализовать» значения, и вам также нужно предоставить какой-то способ оценить, насколько большим должно быть прежде чем асимптотическая формула станет надежным приближением. n
whuber

@whuber Любой может взглянуть на теорему Гнеденко, чтобы увидеть нормализацию. Не менее важными являются характеристики хвоста, которые определяют, какой из трех типов применяется. Теорема обобщается на стационарные случайные процессы. Таким образом, любой, кто хочет узнать мельчайшие подробности, может взглянуть на книгу Лидбеттера или на мою диссертацию. Когда n достаточно велико, трудно ответить на любую асимптотику. Я предполагаю, что теорема Берри-Эссеена помогает для центральной предельной теоремы. Я не знаю, что сопоставимо для крайностей.
Майкл Черник
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.