Обратная функция дисперсии

9

Можно ли найти заданное распределение вероятностей для заданного постоянного числа $r$ (например, 4) для $X$ , чтобы $\mathrm{Var}(X)=r$ ?

distributions mathematical-statistics variance

— amiref
источник

1

Нет, если у вас нет дополнительной информации.

— Хемант Рупани

@ Хемант Рупани, какая дополнительная информация нужна?

— amiref

1

любая природа случайной

— величины

3

Я предлагаю вам отредактировать ваш вопрос, чтобы заменить «значение для X» на «распределение для X» - если X имеет только одно значение, то X имеет вырожденное распределение и будет иметь нулевую дисперсию.

— Серебряная рыба

1

Если

r

$r$ не отрицательный, ответ, очевидно, да, дисперсия может быть любым положительным числом.

— dsaxton

13

$r$ $r=0$ $X$ $\Pr(X=\mu)=1$ $\Pr(X=c)=0$ $c \neq \mu$ $X$ $\mu \in \mathbb{R}$

Если , распределение не найдено, поскольку . $r<0$ $\mathrm{Var}(X)=\mathbb{E}(X-\mu_X)^2 \geq 0$

Для , то ответ будет зависеть от того, какая дополнительная информация известна о . Например, если известно, что имеет среднее значение , то для любого и мы можем найти распределение с этими моментами, взяв . Это не единственное решение проблемы согласования среднего значения и дисперсии, но это единственное нормально распределенное решение (и из всех возможных решений это максимизирует энтропию, как указывает Даниэль). Если вы также хотите соответствовать, например, третьему центральному моменту или выше, вам нужно будет рассмотреть более широкий диапазон распределения вероятностей. $r>0$ $X$ $X$ $\mu$ $\mu \in \mathbb{R}$ $r>0$ $X \sim N(\mu, r)$

Предположим, что вместо этого у нас была некоторая информация о распределении а не о его моментах. Например, если мы знаем, что следует распределению Пуассона, то единственным решением будет . Если мы знаем, что следует экспоненциальному распределению, то снова существует единственное решение , где мы нашли параметр путем решения . $X$ $X$ $X \sim \mathrm{Poisson}(r)$ $X$ $X \sim \mathrm{Exponential}(\frac{1}{\sqrt{r}})$ $\mathrm{Var}(X) = r = \frac{1}{\lambda^2}$

В других случаях мы можем найти целое семейство решений. Если мы знаем, что следует прямоугольному (непрерывному равномерному) распределению, то мы можем найти уникальную ширину для распределения, решив . Но будет целое семейство решений, параметризованное - все распределения в этом множестве являются переводами друг друга. Точно так же, если нормальный, то будет работать любое распределение (поэтому у нас есть целый набор решений, проиндексированных , который снова может быть любым действительным числом, и снова семейство - все переводы друг друга). Если $X$ $w$ $\mathrm{Var}(X) = r = \frac{w^2}{12}$ $X \sim U(a, a+w)$ $a \in \mathbb{R}$ $X$ $X \sim N(\mu, r)$ $\mu$ $X$ следует гамма-распределению, тогда, используя параметризацию масштаба формы, мы можем получить целое семейство решений, параметризованное . Члены этой семьи не являются переводами друг друга. Чтобы помочь визуализировать, как может выглядеть «семейство решений», вот несколько примеров нормальных распределений, проиндексированных , а затем гамма-распределений, индексированных , с дисперсией, равной четырем, что соответствует примеру в ваш вопрос. $X \sim \mathrm{Gamma}(\frac{r}{\theta^2}, \theta)$ $\theta > 0$ $\mu$ $\theta$ $r=4$

Нормальные распределения с дисперсией четыре Гамма-распределения с дисперсией четыре

С другой стороны, для некоторых распределений может быть или не быть возможным найти решение в зависимости от значения . Например, если должна быть переменной Бернулли, то для есть два возможных решения потому что есть две вероятности которые решают уравнение , и на самом деле эти две вероятности дополняют друг друга, т.е. . Для существует только единственное решение , а для распределение Бернулли не имеет достаточно высокой дисперсии. $r$ $X$ $0 \leq r \lt 0.25$ $X \sim \mathrm{Bernoulli}(p)$ $p$ $\mathrm{Var}(X) = r = p(1-p)$ $p_1 + p_2 = 1$ $r=0.25$ $p=0.5$ $r>0.25$

Я чувствую, что должен также упомянуть случай . Есть решения для этого случая тоже, например Стьюдент распределения с двумя степенями свободы. $r = \infty$ $t$

R код для участков

require(ggplot2)

x.df  <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
    mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")

x.df  <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
    theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() + 
    geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
    theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
    coord_cartesian(ylim = c(0, 1))

— тарпон
источник

17

Предполагая, что вы имеете в виду «возможно ли найти распределение вероятностей для », тогда ответ «да», поскольку вы не указали никаких критериев, которым должен соответствовать. На самом деле существует бесконечное число возможных распределений, которые удовлетворяли бы этому условию. Просто рассмотрим нормальное распределение, . Вы можете установить и может принимать любое значение, которое вам нравится - тогда вы получите как требуется. $X$ $X$ $\mathcal{N}(x ; \mu, \sigma^2)$ $\sigma^2 = r$ $\mu$ $Var[X] = r$

На самом деле, нормальное распределение довольно специфично в этом отношении, так как это максимальное распределение вероятностей энтропии для данного среднего значения и дисперсии.

— Даниил
источник

Вы правы, я исправил это. не могли бы вы объяснить больше?

— amiref

@AmirEf Что неясно?

— Даниэль

6

Не совсем понятно, что еще Дэниел должен объяснить; ответ здесь, кажется, имеет дело со всем в вашем опубликованном вопросе.

— Glen_b

15

Этот вопрос можно интерпретировать так, чтобы он был интересным и не совсем тривиальным. При заданном значении которое выглядит как случайная величина, в какой степени можно присвоить вероятности его значениям (или сместить существующие вероятности вокруг) таким образом, чтобы его дисперсия равнялась некоторому заранее заданному числу ? Ответ , что все возможные значения допустимы, до предела определяется диапазоном . $X$ $r$ $r\ge 0$ $X$

Потенциальный интерес к такому анализу заключается в идее изменения меры вероятности при сохранении фиксированной случайной величины для достижения конкретной цели. Хотя это приложение простое, оно отображает некоторые идеи, лежащие в основе теоремы Гирсанова , фундаментальный результат в математических финансах.

Давайте повторим этот вопрос строго и недвусмысленно. предполагать

X : (Ω, S) \to R

$X:(\Omega, \mathfrak{S}) \to \mathbb{R}$

является измеримой функцией, определенной в пространстве мер с сигма-алгеброй . Для данного действительного числа , когда можно найти меру вероятности в этом пространстве, для которой ? $\Omega$ $\mathfrak{S}$ $r \gt 0$ $\mathbb{P}$ $\text{Var}(X) = r$

Я считаю, что ответ заключается в том, что это возможно, когда . $\sup(X) - \inf(X) \gt 2\sqrt{r}$ (Равенство может иметь место, если достигнуты супремум и инфимум: то есть они фактически являются максимумом и минимумом ) Когда либо либо , это условие не накладывает ограничений на , и тогда возможны все неотрицательные значения дисперсии. $X$ $\sup(X)=\infty$ $\inf(X)=-\infty$ $r$

Доказательство построено. Давайте начнем с простой версии, позаботимся о деталях и укажем основную идею, а затем перейдем к реальной конструкции.

Пусть будет в образе : это означает, что существует для которого . Определите функцию набора которая будет индикатором : то есть если и , когда . $x$ $X$ $\omega_x\in\Omega$ $X(\omega_x) = x$ $\mathbb{P}:\mathfrak{S}\to [0,1]$ $\omega_x$ $\mathbb{P}(A) = 0$ $\omega_x\notin A$ $\mathbb{P}(A) = 1$ $\omega_x\in A$

Поскольку , очевидно, удовлетворяет первым двум аксиомам вероятности . Надо показать, что он удовлетворяет третьему; а именно, что это сигма-добавка. Но это почти так же очевидно: всякий раз, когда является конечным или счетно бесконечным множеством взаимоисключающих событий, то ни один из них не содержит - в этом случае для всех или ровно один из них содержит , и в этом случае для некоторого конкретного а в противном случае для всех $\mathbb{P}(\Omega)=1$ $\mathbb P$ $\{E_i, i=1, 2, \ldots\}$ $\omega_x$ $\mathbb{P}(E_i)=0$ $i$ $\omega_x$ $\mathbb{P}(E_j)=1$ $j$ $\mathbb{P}(E_i)=0$ $i\ne j$ , В любом случае

$P (\cup_{i} E_{i}) = \sum_{i} P (E_{i})$ $\mathbb{P}\left(\cup_i E_i\right) = \sum_i \mathbb{P}(E_i)$
потому что обе стороны либо либо оба . $0$ $1$

Поскольку концентрирует всю вероятность на , распределение концентрируется на и должен иметь нулевую дисперсию. $\mathbb{P}$ $\omega_x$ $X$ $x$ $X$
Пусть - два значения в диапазоне ; то есть и . Аналогично предыдущему шагу, определите меру которая будет средневзвешенным значением индикаторов и . Используйте неотрицательные веса и для определения . Как и прежде, мы находим, что - выпуклая комбинация мер индикатора, обсуждаемых в (1), - является вероятностной мерой. Распределение по этой мере является Бернулли $x_1 \le x_2$ $X$ $X(\omega_1) = x_1$ $X(\omega_2) = x_2$ $\mathbb{P}$ $\omega_1$ $\omega_2$ $1-p$ $p$ $p$ $\mathbb{P}$ $X$ $(p)$ распределение, которое было масштабировано с помощью и смещено на . Поскольку дисперсия распределения Бернулли равна , дисперсия должна быть . $x_2-x_1$ $-x_1$ $(p)$ $p(1-p)$ $X$ $(x_2-x_1)^2p(1-p)$

Непосредственным следствием (2) является то, что любой для которого существуют в диапазоне и для которого $r$ $x_1 \le x_2$ $X$ $0 \le p \lt 1$

r = (x_{2} - x_{1})^{2} p (1 - p)

$r = (x_2-x_1)^2p(1-p)$

может быть дисперсия . Поскольку , это подразумевает $X$ $0 \le p(1-p) \le 1/4$

2 \sqrt{r} = \sqrt{4 r} \leq \sqrt{\frac{r}{p (1 - p)}} = \sqrt{(x_{2} - x_{1})^{2}} = x_{2} - x_{1} \leq sup (X) - inf (X),

$2\sqrt{r} = \sqrt{4 r} \le \sqrt{\frac{r}{p(1-p)}} = \sqrt{(x_2-x_1)^2} = x_2-x_1 \le \sup(X)-\inf(X),$

с равенством, если и только если имеет максимум и минимум. $X$

И наоборот, если превышает эту границу , то решение невозможно, поскольку мы уже знаем, что дисперсия любой ограниченной случайной величины не может превышать четверти квадрат его диапазона. $r$ $(\sup(X)-\inf(X))^2/4$

— Whuber
источник

3

Чувак, я думаю, что ты на совершенно ином уровне, чем ОП.

— Марк Л. Стоун

4

@ Марк Наверное. (Я думаю, что вы обнаружили здесь очень сухой юмор.) Но любой, кто применяет тег математической статистики к своему сообщению, должен ожидать такого рода вещи :-).

— whuber

2

Это как-то напоминает мне о том, когда я учился в 4 студенческих классах у покойного профессора Сэмюэля Карлина (среди прочего, Карлина и Тейлора) на «Тотальной позитивности». Тема теории игр как-то возникла. Он сказал, о, теория игр. У вас есть две неотрицательные сигма-конечные меры…. Теперь представьте, что он представляет теорию игр таким образом для студентов в классе экономики новичка в гуманитарном колледже. Это то, что заставило меня задуматься.

— Марк Л. Стоун

@ Марк понял. Никто бы этого не сделал и преуспел. Как вы указываете, я пишу здесь для (подмножество) общих читателей, а не для конкретного. С другой стороны, абстрактный предмет не сложен (на этом начальном уровне) и оказался доступным для мотивированных младших школьников в колледжах гуманитарных наук. Смотрите комментарии на stats.stackexchange.com/a/94876, например.

— whuber

4

@ MarkL.Stone Ответы предназначены не только для непосредственного пользователя (SE предназначен для хранения хороших вопросов и хороших ответов, полезных для более поздних людей с похожими вопросами), и у нас уже есть ответы для более элементарного представления вопроса здесь. , Некоторые другие читатели могут получить что-то из менее элементарного взгляда на вещи, поэтому разнообразие стилей и уровней ответа делает вопрос полезным для большего количества людей.

— Glen_b

10

Да, такое распространение можно найти. Фактически вы можете взять любое распределение с конечной дисперсией и масштабировать в соответствии с вашими условиями, потому что

V a r [c X] = c^{2} V a r [X]

$Var[cX]=c^2Var[X]$

Например, равномерное распределение в интервале имеет дисперсию: Следовательно, равномерное распределение в интервале будет иметь дисперсию . $[0,1]$

σ^{2} = \frac{1}{12}

$\sigma^2=\frac{1}{12}$

[0, \frac{1}{\sqrt{12 r}}]

$\left[0,\frac{1}{\sqrt{12r}}\right]$

r

$r$

Фактически, это распространенный способ добавления параметров в некоторые дистрибутивы, такие как Student t. У него только один параметр - степени свободы. Когда распределение сходится к стандартному нормальному. Он имеет форму колокольчика и выглядит как нормальный, но имеет более толстые хвосты. Вот почему он часто используется в качестве альтернативы нормальному распределению, когда хвосты толстые. Единственная проблема состоит в том, что гауссово распределение имеет два параметра. Итак, приходит масштабированная версия Student t, которую иногда называют распределением « t location scale» . Это очень простое преобразование: , где - местоположение и масштаб. Теперь вы можете установить масштаб так, чтобы новая переменная $\nu$ $\nu\to\infty$ $\xi=\frac{t-\mu}{s}$ $\mu,s$ $\xi$ будет иметь любую требуемую дисперсию и будет иметь форму распределения t студента.

— Аксакал
источник