Каково распределение , где - равномерные распределения?

17

У меня есть четыре независимые равномерно распределенные переменные , каждая в . Я хочу рассчитать распределение . Я вычислил распределение как (отсюда ) и должно быть Теперь распределение суммы равно ( также независимый) потому что $a,b,c,d$ $[0,1]$ $(a-d)^2+4bc$ $u_2=4bc$

f_{2} (u_{2}) = - \frac{1}{4} \ln \frac{u_{2}}{4}

$f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}$

u_{2} \in (0, 4]

$u_2\in(0,4]$

u_{1} = (a - d)^{2}

$u_1=(a-d)^2$

f_{1} (u_{1}) = \frac{1 - \sqrt{u_{1}}}{\sqrt{u_{1}}} .

$f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.$

u_{1} + u_{2}

$u_1+u_2$

u_{1}, u_{2}

$u_1,\, u_2$

f_{u_{1} + u_{2}} (x) = \int_{- \infty}^{+ \infty} f_{1} (x - y) f_{2} (y) d y = - \frac{1}{4} \int_{0}^{4} \frac{1 - \sqrt{x - y}}{\sqrt{x - y}} \cdot \ln \frac{y}{4} d y,

$f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,$

y \in (0, 4]

$y\in(0,4]$ , Здесь должно быть поэтому интеграл равен

Теперь я вставляю его в Mathematica и получаю, что

x > y

$x>y$

f_{u_{1} + u_{2}} (x) = - \frac{1}{4} \int_{0}^{x} \frac{1 - \sqrt{x - y}}{\sqrt{x - y}} \cdot \ln \frac{y}{4} d y .

$f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.$

f_{u_{1} + u_{2}} (x) = \frac{1}{4} [- x + x \ln \frac{x}{4} - 2 \sqrt{x} (- 2 + \ln x)] .

$f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right].$

Я сделал четыре независимых набора $a,b,c,d$ состоящих из $10^6$ чисел каждый, и нарисовал гистограмму $(a-d)^2+4bc$ :

введите описание изображения здесь

и нарисовал график $f_{u_1+u_2}(x)$ :

введите описание изображения здесь

Как правило, график похож на гистограмму, но на интервале $(0,5)$ большая его часть отрицательна (корень находится на уровне 2,27034). И интеграл положительной части составляет $\approx 0.77$ .

Где ошибка? Или где я что-то упустил?

РЕДАКТИРОВАТЬ: я масштабировал гистограмму, чтобы показать PDF.

введите описание изображения здесь

РЕДАКТИРОВАТЬ 2: Я думаю, что я знаю, где проблема в моих рассуждениях - в пределах интеграции. Поскольку и , я не могу просто . На графике показана область, в которую я должен интегрироваться: $y\in (0,4]$ $x-y\in(0,1]$ $\int_0^x$

введите описание изображения здесь

Это означает, что у меня есть для (поэтому часть моего была правильной), в и в . К сожалению, Mathematica не может вычислить последние два интеграла (ну, он действительно вычисляет второй, поскольку в выводе есть мнимая единица, которая все портит ... ). $\int_0^x$ $y\in(0,1]$ $f$ $\int_{x-1}^x$ $y\in(1,4]$ $\int_{x-1}^4$ $y\in (4,5]$

РЕДАКТИРОВАТЬ 3: Похоже, что Mathematica МОЖЕТ вычислить последние три интеграла с помощью следующего кода:

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,u1}, Assumptions -> 1 <= u2 <= 3 && u1 > 0]

(1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,u1-1,4}, Assumptions -> 4 <= u2 <= 4 && u1 > 0]

который дает правильный ответ :)

— corey979
источник

2

Мне нравится, что вы пытались проверить обоснованность своего ответа с помощью симуляции. Ваша проблема в том, что вы знаете , что сделали ошибку, но не видите, где именно. Рассматривали ли вы, что вы можете проверить каждую стадию вашего метода, чтобы найти причину ошибки? Например, ошибка лежит в вашем ? Что ж, вы можете проверить свой расчетный PDF по смоделированным результатам так же, как вы сделали для вашего окончательного ответа. То же самое для . Если и оба верны, то вы сделали ошибку при их объединении. Такая пошаговая проверка позволяет вам точно определить, где вы ошиблись!

f_{1} (u_{1})

$f_1(u_1)$

f_{2}

$f_2$

f_{1}

$f_1$

f_{2}

$f_2$

— Серебряная рыбка

Я выбросил свою первую попытку и пересчитал ее с нуля. Я считаю, что и верны, хотя мне пришлось вручную умножить мой начальный на 2, чтобы нормализовать его до единицы. Но это только меняет высоту и не объясняет, почему у меня отрицательный .

f_{1}

$f_1$

f_{2}

$f_2$

f_{1}

$f_1$

f

$f$

— corey979

При создании таких гистограмм для сравнения с вычисленными алгебраическими величинами масштабируйте гистограмму до допустимой плотности (и накладывайте их, если можете). Сделайте аналогичную проверку для ваших f1 и f2, чтобы убедиться, что у вас есть те права; если они правы (я пока не вижу веских оснований подозревать их, но лучше перепроверить), тогда проблема должна быть позже.

— Glen_b

19

Часто это помогает использовать кумулятивные функции распределения.

Первый,

F (x) = Pr ((a - d)^{2} \leq x) = Pr (| a - d | \leq \sqrt{x}) = 1 - (1 - \sqrt{x})^{2} = 2 \sqrt{x} - x .

$F(x) = \Pr((a-d)^2 \le x) = \Pr(|a-d| \le \sqrt{x}) = 1 - (1-\sqrt{x})^2 = 2\sqrt{x} - x.$

Следующий,

G (y) = Pr (4 b c \leq y) = Pr (b c \leq \frac{y}{4}) = \int_{0}^{y / 4} d t + \int_{y / 4}^{1} \frac{y d t}{4 t} = \frac{y}{4} (1 - \log (\frac{y}{4})) .

$G(y) = \Pr(4 b c \le y) = \Pr(b c \le \frac{y}{4}) = \int_0^{y/4} dt + \int_{y/4}^1\frac{y\,dt}{4t} = \frac{y}{4}\left(1 - \log\left(\frac{y}{4}\right)\right).$

Пусть между наименьшим ( ) и наибольшим ( ) возможными значениями . Запись с CDF и с PDF , нам нужно вычислить $\delta$ $0$ $5$ $(a-d)^2 + 4 b c$ $x=(a-d)^2$ $F$ $y=4 b c$ $g = G^\prime$

H (δ) = Pr ((a - d)^{2} + 4 b c \leq δ) = Pr (x \leq δ - y) = \int_{0}^{4} F (δ - y) g (y) d y .

$H(\delta) = \Pr((a-d)^2 + 4 b c \le \delta) = \Pr(x\le \delta-y) = \int_0^4 F(\delta-y)g(y)dy.$

Мы можем ожидать, что это будет неприятно - равномерное распределение PDF является прерывистым и, следовательно, должно приводить к разрывам в определении поэтому удивительно, что Mathematica получает закрытую форму (которую я не буду здесь воспроизводить). Дифференцирование его по отношению к дает желаемую плотность. Он определяется кусочно в течение трех интервалов. В , $H$ $\delta$ $0 \lt \delta \lt 1$

H^{'} (δ) = h (δ) = \frac{1}{8} (8 \sqrt{δ} + δ (- (2 + \log (16))) + 2 (δ - 2 \sqrt{δ}) \log (δ)) .

$H^\prime(\delta) = h(\delta) = \frac{1}{8} \left(8 \sqrt{\delta }+\delta (-(2+\log (16)))+2 \left(\delta -2 \sqrt{\delta }\right) \log (\delta )\right).$

В , $1 \lt \delta \lt 4$

h (δ) = \frac{1}{4} (- (δ + 1) \log (δ - 1) + δ \log (δ) - 4 \sqrt{δ} \coth^{- 1} (\sqrt{δ}) + 3 + \log (4)) .

$h(\delta) = \frac{1}{4} \left(-(\delta +1) \log (\delta -1)+\delta \log (\delta )-4 \sqrt{\delta } \coth ^{-1}\left(\sqrt{\delta }\right)+3+\log (4)\right).$

А в , $4 \lt \delta \lt 5$

\begin{aligned} h (δ) = \\ \frac{1}{4} (δ - 4 \sqrt{δ - 4} + (δ + 1) \log (\frac{4}{δ - 1}) + 4 \sqrt{δ} \tanh^{- 1} (\frac{\sqrt{(δ - 4) δ} - \sqrt{δ}}{δ - \sqrt{δ - 4}}) - 1) . \end{aligned}

$\eqalign{ &h(\delta) = \\ &\frac{1}{4}\left(\delta -4 \sqrt{\delta -4}+(\delta +1) \log \left(\frac{4}{\delta -1}\right)+4 \sqrt{\delta } \tanh ^{-1}\left(\frac{\sqrt{(\delta -4) \delta }-\sqrt{\delta }}{\delta -\sqrt{\delta -4}}\right)-1\right). }$

фигура

Эта фигура перекрывает график на гистограмме из iid реализаций . Они почти неразличимы, что свидетельствует о правильности формулы для . $h$ $10^6$ $(a-d)^2 + 4bc$ $h$

Следующее - почти бессмысленное решение Mathematica с грубой силой . Это автоматизирует практически все в расчете. Например, он даже вычислит диапазон результирующей переменной:

ClearAll[ a, b, c, d, ff, gg, hh, g, h, x, y, z, zMin, zMax, assumptions];
assumptions = 0 <= a <= 1 && 0 <= b <= 1 && 0 <= c <= 1 && 0 <= d <= 1; 
zMax = First@Maximize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];
zMin = First@Minimize[{(a - d)^2 + 4 b c, assumptions}, {a, b, c, d}];

Здесь все интеграции и дифференциации. (Будьте терпеливы; вычисление занимает пару минут.) $H$

ff[x_] := Evaluate@FullSimplify@Integrate[Boole[(a - d)^2 <= x], {a, 0, 1}, {d, 0, 1}];
gg[y_] := Evaluate@FullSimplify@Integrate[Boole[4 b c <= y], {b, 0, 1}, {c, 0, 1}];
g[y_]  := Evaluate@FullSimplify@D[gg[y], y];
hh[z_] := Evaluate@FullSimplify@Integrate[ff[-y + z] g[y], {y, 0, 4}, 
          Assumptions -> zMin <= z <= zMax];
h[z_]  :=  Evaluate@FullSimplify@D[hh[z], z];

Наконец, симуляция и сравнение с графиком : $h$

x = RandomReal[{0, 1}, {4, 10^6}];
x = (x[[1, All]] - x[[4, All]])^2 + 4 x[[2, All]] x[[3, All]];
Show[Histogram[x, {.1}, "PDF"], 
 Plot[h[z], {z, zMin, zMax}, Exclusions -> {1, 4}], 
 AxesLabel -> {"\[Delta]", "Density"}, BaseStyle -> Medium, 
 Ticks -> {{{0, "0"}, {1, "1"}, {4, "4"}, {5, "5"}}, Automatic}]

— Whuber
источник

8

(+1), особенно для напоминания людям, что вместо того, чтобы говорить о свертках плотности, «часто это помогает использовать кумулятивные функции распределения», особенно когда они имеют такую простую форму, как здесь. И ты тоже был чертовски быстр.

— Алекос Пападопулос

F (x)

$F(x)$

G (y)

$G(y)$

F

$F$

g

$g$

H

$H$

F

$F$

G

$G$

7

Как и OP и Whuber, я бы использовал независимость, чтобы разбить это на более простые проблемы:

$X = (a-d)^2$ $X$ $f(x)$

$Y = 4 b c$ $Y$ $g(y)$

$X + Y$ TransformSum

TransformSum[{f,g}, z]

$Z = X + Y$

$h(z)$

Быстрая проверка Монте-Карло

Следующая диаграмма сравнивает эмпирическое приближение pdf (волнистый синий) с точки зрения Монте-Карло с теоретическим pdf, полученным выше (красная пунктирная линия). Выглядит хорошо.

— wolfies
источник