Почему число непрерывных равномерных переменных в (0,1), необходимое для того, чтобы их сумма превышала единицу, имеет среднее значение

Суммируем поток случайных величин: ; пусть будет числом слагаемых, которое нам нужно, чтобы сумма превысила единицу, т. е. - наименьшее число, такое, что $X_i \overset{iid}\sim \mathcal{U}(0,1)$ $Y$ $Y$

X_{1} + X_{2} + \dots + X_{Y} > 1.

$X_1 + X_2 + \dots + X_Y > 1.$

Почему среднее значение равно постоянной Эйлера ? $Y$ $e$

E (Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \dots

$\mathbb{E}(Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} + \dots$

— тарпон
источник

Я публикую это в духе вопроса для самостоятельного изучения, хотя думаю, что впервые увидел этот вопрос более десяти лет назад. Я не могу вспомнить, как я ответил на это тогда, хотя я уверен, что это было не то, что пришло в голову, когда я увидел это свойство, упомянутое в теме Приблизительно

e

$e$ с использованием моделирования Монте-Карло . Поскольку я подозреваю, что это довольно распространенный вопрос, я решил представить эскиз, а не полное решение, хотя я полагаю, что основное «предупреждение о спойлере» относится к самому вопросу!

— Серебряная

Я по-прежнему очень заинтересован в альтернативных подходах; Я знаю, что это было включено в качестве вопроса в теорию вероятности Гнеденко (первоначально на русском языке, но широко переведена), но я не знаю, какое решение ожидалось там или было поставлено в другом месте.

— Серебряная рыбка

Я написал решение для симуляции в MATLAB, используя ваш симплекс-метод. Я не знал о связи с симплексами, это так неожиданно.

— Аксакал почти наверняка бинарный

Ответы:

Первое наблюдение: у $Y$ есть более приятный CDF, чем PMF

Массовая функция вероятности $p_Y(n)$ - это вероятность того, что $n$ «достаточно» для того, чтобы сумма превысила единицу, то есть $X_1 + X_2 + \dots X_n$ превышает единицу, тогда как $X_1 + \dots + X_{n-1}$ делает не.

Кумулятивное распределение просто требует, чтобы «достаточно», т. без ограничения на сколько. Это выглядит как гораздо более простое событие, чтобы справиться с вероятностью. $F_Y(n) = \Pr(Y \leq n)$ $n$ $\sum_{i=1}^{n}X_i > 1$

Второе наблюдение: принимает неотрицательные целочисленные значения, поэтому можно записать в терминах CDF $Y$ $\mathbb{E}(Y)$

Ясно , что может принимать только значения в , так что мы можем написать его среднее с точки зрения дополнительного КОР , . $Y$ $\{0, 1, 2, \dots\}$ $\bar F_Y$

E (Y) = \sum_{n = 0}^{\infty} {\bar{F}}_{Y} (n) = \sum_{n = 0}^{\infty} (1 - F_{Y} (n))

$\mathbb{E}(Y) = \sum_{n=0}^\infty \bar F_Y(n) = \sum_{n=0}^\infty \left(1 - F_Y(n) \right)$

На самом деле и оба равны нулю, поэтому первые два члена . $\Pr(Y=0)$ $\Pr(Y=1)$ $\mathbb{E}(Y) = 1 + 1 + \dots$

Что касается более поздних сроках, если вероятность того, что , какое событие является вероятность? $F_Y(n)$ $\sum_{i=1}^{n}X_i > 1$ $\bar F_Y(n)$

Третье наблюдение: (гипер) объем симплекса равен $n$ $\frac{1}{n!}$

симплекс я имею в виду , занимает объем при в стандартных единицах симплекс в все-инфицированного ортантом из : это выпуклая оболочка вершин, в частности , происхождение плюс вершины единичного -симплекса в , $n$ $(n-1)$ $\mathbb{R}^n$ $(n+1)$ $(n-1)$ $(1, 0, 0, \dots)$ и т. д. $(0, 1, 0, \dots)$

Например, вышеприведенный 2-симплекс с имеет площадь $x_1 + x_2 \leq 1$ и 3-симплекс симеет объем $\frac{1}{2}$ $x_1 + x_2 + x_3 \leq 1$ . $\frac{1}{6}$

Для доказательства того, что происходит путем оценки непосредственно интеграл для вероятности события , описываемого , а также ссылки на два других аргументов см это Math SE нить . Связанный поток также может представлять интерес: существует ли связь между и суммой объемов симплексов? $\bar F_Y(n)$ $e$ $n$

— тарпон
источник

Это интересный геометрический подход, и его легко решить таким образом. Прекрасный. Вот уравнение для объема симплекса.

— Честно

+1 Вы также можете получить полное распространение

из любого из подходов в моем посте по адресу stats.stackexchange.com/questions/41467/… .

Y

$Y$

— whuber

Если бы я наткнулся на это решение, то ни за что бы они не заставили меня сделать это иначе в школе :)

— Аксакал почти наверняка бинарный

Зафиксируйте . Пусть $n \ge 1$ - дробные части частичных сумм для . Независимая однородность и гарантирует, что такой же вероятностью будет превышать как и меньше его. Это означает, чтовсеупорядочения последовательности одинаково вероятны.

U_{i} = X_{1} + X_{2} + \dots + X_{i} \mod 1

$U_i = X_1 + X_2 + \cdots + X_i \mod 1$

i = 1, 2, \dots, n

$i=1,2,\ldots, n$

X_{1}

$X_1$

X_{i + 1}

$X_{i+1}$

U_{i + 1}

$U_{i+1}$

U_{i}

$U_i$ $n!$ $(U_i)$

Учитывая последовательность , мы можем восстановить последовательность . Чтобы увидеть, как, обратите внимание, что $U_1, U_2, \ldots, U_n$ $X_1, X_2, \ldots, X_n$

потому что оба находятся между и . $U_1 = X_1$ $0$ $1$
Если , то . $U_{i+1} \ge U_i$ $X_{i+1} = U_{i+1} - U_i$
В противном случае , откуда . $U_i + X_{i+1} \gt 1$ $X_{i+1} = U_{i+1} - U_i + 1$

Существует ровно одна последовательность, в которой уже находятся в возрастающем порядке, и в этом случае . Быть одним из одинаково вероятные последовательности, у этого есть шанс происходящего. Во всех других последовательностях по меньшей мере один шаг от до не в порядке. Это означает, что сумма должен был равняться или превышать $U_i$ $1 \gt U_n = X_1 + X_2 + \cdots + X_n$ $n!$ $1/n!$ $U_i$ $U_{i+1}$ $X_i$ $1$ , Таким образом, мы видим, что

Pr (Y > n) = Pr (X_{1} + X_{2} + \dots + X_{n} \leq 1) = Pr (X_{1} + X_{2} + \dots + X_{n} < 1) = \frac{1}{n!} .

$\Pr(Y \gt n) = \Pr(X_1 + X_2 + \cdots + X_n \le 1) = \Pr(X_1 + X_2 + \cdots + X_n \lt 1) = \frac{1}{n!}.$

Это дает вероятности для всего распределения , так как для интеграла $Y$ $n\ge 1$

Pr (Y = n) = Pr (Y > n - 1) - Pr (Y > n) = \frac{1}{(n - 1)!} - \frac{1}{n!} = \frac{n - 1}{n!} .

$\Pr(Y = n) = \Pr(Y \gt n-1) - \Pr(Y \gt n) = \frac{1}{(n-1)!} - \frac{1}{n!} = \frac{n-1}{n!}.$

Более того,

E (Y) = \sum_{n = 0}^{\infty} Pr (Y > n) = \sum_{n = 0}^{\infty} \frac{1}{n!} = e,

$\mathbb{E}(Y) = \sum_{n=0}^\infty \Pr(Y \gt n) = \sum_{n=0}^\infty \frac{1}{n!} = e,$

QED.

— whuber
источник

I have read it a couple of times, and I almost get it... I posted a couple of questions in the Mathematics SE as a result of the

e

$e$ constant computer simulation. I don't know if you saw them. One of them came back before your kind explanation on Tenfold about the ceiling function of the

1 / U (0, 1)

$1/U(0,1)$ and the Taylor series. The second one was exactly about this topic, never got a response, until now...

— Antoni Parellada

here and here.

— Antoni Parellada

And could you add the proof with the uniform spacings as well?

— Xi'an

@Xi'an Could you indicate more specifically what you mean by "uniform spacings" in this context?

— whuber

I am referring to your Poisson process simulation via the uniform spacing, in the thread Approximate e using Monte Carlo Simulation for which I cannot get a full derivation.

— Xi'an

In Sheldon Ross' A First Course in Probability there is an easy to follow proof:

Modifying a bit the notation in the OP, $U_i \overset{iid}\sim \mathcal{U}(0,1)$ and $Y$ the minimum number of terms for $U_1 + U_2 + \dots + U_Y > 1$ , or expressed differently:

Y = m i n {n : \sum_{i = 1}^{n} U_{i} > 1}

$Y = min\Big\{n: \sum_{i=1}^n U_i>1\Big\}$

If instead we looked for:

Y (u) = m i n {n : \sum_{i = 1}^{n} U_{i} > u}

$Y(u) = min\Big\{n: \sum_{i=1}^n U_i>u\Big\}$ for

u \in [0, 1]

$u\in[0,1]$ , we define the

f (u) = E [Y (u)]

$f(u)=\mathbb E[Y(u)]$ , expressing the expectation for the number of realizations of uniform draws that will exceed

u

$u$ when added.

We can apply the following general properties for continuous variables:

$E[X] = E[E[X|Y]]=\displaystyle\int_{-\infty}^{\infty}E[X|Y=y]\,f_Y(y)\,dy$

to express $f(u)$ conditionally on the outcome of the first uniform, and getting a manageable equation thanks to the pdf of $X \sim U(0,1)$ , $f_Y(y)=1.$ This would be it:

\begin{matrix} (1) & f (u) = \int_{0}^{1} E [Y (u) | U_{1} = x] d x \end{matrix}

$f(u)=\displaystyle\int_0^1 \mathbb E[Y(u)|U_1=x]\,dx \tag 1$

If the $U_1=x$ we are conditioning on is greater than $u$ , i.e. $x>u$ , $\mathbb E[Y(u)|U_1=x] =1 .$ If, on the other hand, $x <u$ , $\mathbb E[Y(u)|U_1=x] =1 + f(u - x)$ , because we already have drawn $1$ uniform random, and we still have the difference between $x$ and $u$ to cover. Going back to equation (1):

f (u) = 1 + \int_{0}^{x} f (u - x) d x

$f(u) = 1 + \displaystyle\int_0^x f(u - x) \,dx$ , and with substituting

w = u - x

$w = u - x$ we would have

f (u) = 1 + \int_{0}^{x} f (w) d w

$f(u) = 1 + \displaystyle\int_0^x f(w) \,dw$ .

If we differentiate both sides of this equation, we can see that:

f^{'} (u) = f (u) ⟹ \frac{f^{'} (u)}{f (u)} = 1

$f'(u) = f(u)\implies \frac{f'(u)}{f(u)}=1$

with one last integration we get:

l o g [f (u)] = u + c ⟹ f (u) = k e^{u}

$log[f(u)] = u + c \implies f(u) = k \,e^u$

We know that the expectation that drawing a sample from the uniform distribution and surpassing $0$ is $1$ , or $f(0) = 1$ . Hence, $k = 1$ , and $f(u)=e^u$ . Therefore $f(1) = e.$

— Antoni Parellada
источник

I do like the manner in which this generalises the result.

— Silverfish