Учитывая случайную величину
где - однородные переменные IID, как рассчитать PDF для ?
Учитывая случайную величину
где - однородные переменные IID, как рассчитать PDF для ?
Ответы:
Возможно, этот вопрос - домашнее задание, но я чувствовал, что этот классический элементарный вопрос о вероятности все еще не получил полного ответа через несколько месяцев, поэтому я дам его здесь.
Из постановки задачи мы хотим, чтобы распределение
где - это iid . Мы знаем, что тогда и только тогда, когда каждый элемент выборки меньше . Тогда это, как указано в подсказке @ varty, в сочетании с тем фактом, что независимы, позволяет нам сделать вывод
где - CDF равномерного распределения . Следовательно, CDF для имеет вид
Поскольку имеет абсолютно непрерывное распределение, мы можем вывести его плотность, дифференцируя CDF . Поэтому плотность является
В частном случае, когда , мы имеем , то есть плотность распределения бета с и , поскольку .
Как примечание, последовательность, которую вы получаете, если сортируете свою выборку в возрастающем порядке - - называется статистикой заказа . Обобщение этого ответа состоит в том, что все статистические данные порядка распределенной выборки имеют бета-распределение , как отмечено в ответе @ bnaul.
Максимум выборки - это одна из статистики порядка , в частности статистика го порядка выборки . В общем, вычисление распределения статистики заказов затруднено, как описано в статье в Википедии; для некоторых специальных распределений статистика порядка хорошо известна (например, для равномерного распределения, которое имеет бета-распределенную статистику порядка).
РЕДАКТИРОВАТЬ: статья в Википедии о максимуме и минимуме образца также полезна и более специфична для вашей проблемы.
Максимум набора случайных величин IID при соответствующей нормализации обычно сходится к одному из трех типов экстремальных значений. Это теорема Гнеденко, эквивалентность центральной предельной теоремы для крайностей. Конкретный тип зависит от поведения хвоста распределения популяции. Зная это, вы можете использовать предельное распределение, чтобы приблизить распределение к максимуму.
Поскольку равномерное распределение на [a, b] является предметом этого вопроса, Макро дал точное распределение для любого n и очень хороший ответ. Результат довольно тривиальный. Для нормального распределения хорошая замкнутая форма невозможна, но соответственно нормализованный максимум для нормального сходится к распределению Гумбеля F (x) = exp (- e ).
Для униформы нормализация равна (ba) -x / n и F (bax / n) = (1-x / [n (ba)])
которая сходится к е . Обратите внимание, что y = bax / n. и F (y) сходится к 1, когда y переходит к ba. Это верно для всех 0
В этом случае легко сравнить точное значение с его асимптотическим пределом.