Brain-teaser: Какова ожидаемая длина последовательности iid, которая монотонно увеличивается при получении из равномерного распределения [0,1]?


28

Это вопрос интервью для позиции количественного аналитика, о котором сообщается здесь . Предположим, что мы рисуем из равномерного распределения а ничьи идентифицированы, какова ожидаемая длина монотонно увеличивающегося распределения? Т.е. мы прекращаем рисование, если текущее рисование меньше или равно предыдущему.[0,1]

Я получил первые несколько: \ Pr (\ text {length} = 2) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/3 \ Pr (\ text {length} = 3) = \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_ {x_2} ^ 1 \ int_0 ^ {x_3} \ mathrm {d} x_4 \, \ mathrm { d} x_3 \, \ mathrm {d} x_2 \, \ mathrm {d} x_1 = 1/8

Pr(length=1)=010x1dx2dx1=1/2
Pr(length=2)=01x110x2dx3dx2dx1=1/3
Pr(length=3)=01x11x210x3dx4dx3dx2dx1=1/8

но мне все труднее вычислять эти вложенные интегралы, и я не получаю «трюк» для обобщения в Pr(length=n) . Я знаю, что окончательный ответ структурирован

E(length)=n=1nPr(length=n)

Есть идеи, как ответить на этот вопрос?

Ответы:


37

Вот несколько общих советов по решению этого вопроса:

У вас есть последовательность непрерывных случайных величин IID, что означает, что они являются взаимозаменяемыми . Что это означает о вероятности получения определенного порядка для первых n значений? Исходя из этого, какова вероятность получения возрастающего порядка для первых n значений? Это можно выяснить, не интегрируя по распределению основных случайных величин. Если вы сделаете это хорошо, вы сможете получить ответ без какого-либо предположения о равномерном распределении - т.е. вы получите ответ, который применим для любых заменяемых последовательностей непрерывных случайных величин.


Вот полное решение ( не смотрите, если вы должны выяснить это самостоятельно ):

Пусть - ваша последовательность независимых непрерывных случайных величин, и пусть - количество увеличивающихся элементов в начале последовательности. Поскольку это непрерывные взаимозаменяемые случайные величины, они почти наверняка не равны друг другу, и любой порядок одинаково вероятен, поэтому имеем: (Обратите внимание, что этот результат справедлив для любой последовательности IID непрерывных случайных величин; они не должны иметь равномерное распределение.) Таким образом, случайная величина имеет функцию вероятности массыU1,U2,U3,IID Continuous DistNmax{nN|U1<U2<<Un}

P(Nn)=P(U1<U2<<Un)=1n!.
N
pN(n)=P(N=n)=1n!1(n+1)!=n(n+1)!.
Вы заметите, что этот результат соответствует значениям, которые вы вычислили, используя интеграцию по базовым значениям. (Эта часть не нужна для решения; она включена для полноты.) Используя известное правило для ожидаемого значения неотрицательной случайной величины , мы имеем: Еще раз отметим, что в нашей работе нет ничего, что использовало бы базовое равномерное распределение. Следовательно, это общий результат, который применим к любой заменяемой последовательности непрерывных случайных величин.
E(N)=n=1P(Nn)=n=11n!=e1=1.718282.

Некоторые дальнейшие идеи:

Из вышеприведенной работы мы видим, что этот результат распределения и полученное ожидаемое значение не зависят от базового распределения, если оно является непрерывным распределением. Это на самом деле неудивительно, если учесть тот факт, что каждая непрерывная скалярная случайная величина может быть получена путем монотонного преобразования равномерной случайной величины (причем преобразование является ее квантовой функцией). Поскольку монотонные преобразования сохраняют порядок рангов, рассмотрение вероятностей упорядочения произвольных непрерывных случайных величин IID аналогично рассмотрению вероятностей упорядочения равномерных случайных величин IID .


6
Красиво сделано! (+1)
jbowman

1
@ Я буду следовать за тобой до последнего уравнения ... Я думал, что ожидаемое значение должно бытьвместо ... не могли бы вы объяснить эту часть подробнее?
E(N)=n=1P(N=n)n=n=1n2/(n+1)!
E(N)=n=1P(Nn)
Амазонка

5
Это хорошо известное правило для ожидаемого значения неотрицательной случайной величины . Используя технику, включающую изменение порядка суммирования, вы получаете: Поэтому вы должны найти, что .
E(N)=n=1nP(N=n)=n=1k=1nP(N=n)=n=1k=nP(N=k)=n=1P(Nn).
n1n!=nn2(n+1)!
Восстановите Монику

Не могли бы вы пояснить, почему ? P(Nn)=P(U1<U2<<Un)
Badmax

1
@badmax: случайная величина - это число возрастающих элементов в начале последовательности (см. ее определение). Таким образом, если это означает, что в начале последовательности есть по крайней мере увеличивающихся элементов. Это означает, что первые элементов должны быть в порядке возрастания, который равен . NUNnnnU1<U2<<Un
Восстановить Монику

8

Другой метод решения, который дает вам решение для более общего случая.

Предположим, что является ожидаемой длиной монотонной последовательности , такой, что . Значение, которое мы хотим вычислить, равно . И мы знаем . Кондиционирование на следующем значении,F(x){x1,x2,...}xx1x2F(0)F(1)=0

F(x)=0xπ(y)0dy+x1π(y)(1+F(y))dy=x11+F(y)dy

где - плотность U [0,1]. Такπ(y)=1

F(x)=(1+F(x))

Решая с граничным условием , получаем . Следовательно, .F(1)=0F(x)=e(1x)1F(0)=e1


2
Это очень умно. Просто поясним это немного: ваши наблюдения таковы: 1) если - длина самой длинной начальной возрастающей последовательности минус один, то достаточно определить и установить и 2) равно нулю, если и противном случае. Поскольку мы получаем , который в едином случае может быть решен непосредственно. LE(L|X0=x)=:F(x)x=0E(L|X0=x,X1=y)y<x1+E(L|X0=y)E(L|X0=x)=E(E(L|X0=x,X1))=RfX(y)E(L|X0=x,X1=y)dy=x1fX(y)(1+E(L|X0=y))dy=x1fX(y)(1+F(y))dyF(x)=fX(x)(1+F(x))
Мэтью Тауэрс

2
+1 Очень умно на самом деле. Но поскольку окончательный ответ не зависит от распределения (как обсуждается в другом ответе), это вычисление также не должно зависеть от . Есть ли способ увидеть это? CC для @m_t_. π(y)
амеба говорит восстановить Монику

3
@amoeba Я согласен, что не должен зависеть от распределения s, но другие значения должны: общее решение этого DE -F(0)XFF=Ceπ1
Мэтью Тауэрс

1
@MartijnWeterings Я думаю, что , а не 1, например, в едином случае мы получимC=eeex1
Мэтью Тауэрс

1
Да ты прав. Я использовал единый случай, чтобы вывести свое утверждение, но ошибочно использовал вместоce1x1cex1
Sextus Empiricus

0

Еще один метод решения - вычислить интеграл напрямую.

Вероятность генерации последовательности, чья возрастающая часть имеет длину равна , где .nfn(0)fn(x)=x1x11x21...xn21xn11dxndxn1...dx2dx1

Что нам нужно сделать, это вычислить .fn(0)

Если вы попытаетесь вычислить первые несколько , возможно, вы обнаружите, чтоfn(x)fn(x)=t=0n(x)tt!(nt)!

Базовый случай: когда ,n=1f1(x)=t=01(x)tt!(nt)!=1x=x1dx1

Индуктивная гипотеза: когда ,n=kfn(x)=t=0k(x)tt!(kt)! , for k1

Шаг индукции: когда ,n=k+1

     fn(x)=fk+1(x)=x1fk(x)dx

=x1t=0k(x)tt!(kt)!dx

=t=0k(x)t+1t!(kt)!×(t+1)|x1=t=0k(x)t+1(t+1)!(kt)!|x1

=t=1k+1(x)tt!(kt+1)!|x1

=t=1k+1(1)t+1t!(kt+1)!+t=1k+1(x)tt!(kt+1)!

=t=1k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!+t=0k+1(1)t+1Ctk+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=1(k+1)!(11)k+1(k+1)!+t=1k+1(x)tt!(kt+1)!

=t=0k+1(x)tt!(kt+1)!

По математической индукции предположение верно.

Таким образом, мы получаем, чтоfn(0)=1n!

Итак,E(length)=n=1Pr(lengthn)=n=11n!=e1

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.