Можно ли найти заданное распределение вероятностей для заданного постоянного числа (например, 4) для , чтобы ?
Можно ли найти заданное распределение вероятностей для заданного постоянного числа (например, 4) для , чтобы ?
Ответы:
c ≠ µ X µ ∈ R
Если , распределение не найдено, поскольку .V a r ( X ) = E ( X - μ X ) 2 ≥ 0
Для , то ответ будет зависеть от того, какая дополнительная информация известна о . Например, если известно, что имеет среднее значение , то для любого и мы можем найти распределение с этими моментами, взяв . Это не единственное решение проблемы согласования среднего значения и дисперсии, но это единственное нормально распределенное решение (и из всех возможных решений это максимизирует энтропию, как указывает Даниэль). Если вы также хотите соответствовать, например, третьему центральному моменту или выше, вам нужно будет рассмотреть более широкий диапазон распределения вероятностей.X X μ μ ∈ R r > 0 X ∼ N ( μ , r )
Предположим, что вместо этого у нас была некоторая информация о распределении а не о его моментах. Например, если мы знаем, что следует распределению Пуассона, то единственным решением будет . Если мы знаем, что следует экспоненциальному распределению, то снова существует единственное решение , где мы нашли параметр путем решения .Х Х ~ Р о я ы с о н ( г ) Х Х ~ Е х р о л е н т I а л ( 1Var(X)=r=1
В других случаях мы можем найти целое семейство решений. Если мы знаем, что следует прямоугольному (непрерывному равномерному) распределению, то мы можем найти уникальную ширину для распределения, решив . Но будет целое семейство решений, параметризованное - все распределения в этом множестве являются переводами друг друга. Точно так же, если нормальный, то будет работать любое распределение (поэтому у нас есть целый набор решений, проиндексированных , который снова может быть любым действительным числом, и снова семейство - все переводы друг друга). Еслиw V a r ( X ) = r = w 2 X∼U(a,a+w)a∈RXX∼N(μ,r)μXX∼Gamma(r следует гамма-распределению, тогда, используя параметризацию масштаба формы, мы можем получить целое семейство решений, параметризованное . Члены этой семьи не являются переводами друг друга. Чтобы помочь визуализировать, как может выглядеть «семейство решений», вот несколько примеров нормальных распределений, проиндексированных , а затем гамма-распределений, индексированных , с дисперсией, равной четырем, что соответствует примеру в ваш вопрос.θ>0μθr=4
С другой стороны, для некоторых распределений может быть или не быть возможным найти решение в зависимости от значения . Например, если должна быть переменной Бернулли, то для есть два возможных решения потому что есть две вероятности которые решают уравнение , и на самом деле эти две вероятности дополняют друг друга, т.е. . Для существует только единственное решение , а для распределение Бернулли не имеет достаточно высокой дисперсии.X 0 ≤ r < 0,25 X ∼ B e r n o u l l i ( p ) p V a r ( X ) = r = p ( 1 - p ) p 1 + p 2 = 1 r = 0,25 p = 0,5 r > 0,25
Я чувствую, что должен также упомянуть случай . Есть решения для этого случая тоже, например Стьюдент распределения с двумя степенями свободы.t
R код для участков
require(ggplot2)
x.df <- data.frame(x = rep(seq(from=-8, to=8, length=100), times=5),
mu = rep(c(-4, -2, 0, 2, 4), each=100))
x.df$pdf <- dnorm(mean=x.df$mu, x.df$x)
ggplot(x.df, aes(x=x, y=pdf, group=factor(mu), colour=factor(mu))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(mu), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Normal distributions with variance 4")
x.df <- data.frame(x = rep(seq(from=0, to=20, length=1000), times=5),
theta = rep(c(0.25, 0.5, 1, 2, 4), each=1000))
x.df$pdf <- dgamma(x.df$x, shape=4/(x.df$theta)^2, scale=x.df$theta)
ggplot(x.df, aes(x=x, y=pdf, group=factor(theta), colour=factor(theta))) + theme_bw() +
geom_line(size=1) + scale_colour_brewer(name=expression(theta), palette="Set1") +
theme(legend.key = element_blank()) + ggtitle("Gamma distributions with variance 4") +
coord_cartesian(ylim = c(0, 1))
Предполагая, что вы имеете в виду «возможно ли найти распределение вероятностей для », тогда ответ «да», поскольку вы не указали никаких критериев, которым должен соответствовать. На самом деле существует бесконечное число возможных распределений, которые удовлетворяли бы этому условию. Просто рассмотрим нормальное распределение, . Вы можете установить и может принимать любое значение, которое вам нравится - тогда вы получите как требуется.X N ( x ; μ , σ 2 ) σ 2 = r μ V a r [ X ] = r
На самом деле, нормальное распределение довольно специфично в этом отношении, так как это максимальное распределение вероятностей энтропии для данного среднего значения и дисперсии.
Этот вопрос можно интерпретировать так, чтобы он был интересным и не совсем тривиальным. При заданном значении которое выглядит как случайная величина, в какой степени можно присвоить вероятности его значениям (или сместить существующие вероятности вокруг) таким образом, чтобы его дисперсия равнялась некоторому заранее заданному числу ? Ответ , что все возможные значения допустимы, до предела определяется диапазоном .r r ≥ 0 X
Потенциальный интерес к такому анализу заключается в идее изменения меры вероятности при сохранении фиксированной случайной величины для достижения конкретной цели. Хотя это приложение простое, оно отображает некоторые идеи, лежащие в основе теоремы Гирсанова , фундаментальный результат в математических финансах.
Давайте повторим этот вопрос строго и недвусмысленно. предполагать
является измеримой функцией, определенной в пространстве мер с сигма-алгеброй . Для данного действительного числа , когда можно найти меру вероятности в этом пространстве, для которой ?S r > 0 P Var ( X ) = r
Я считаю, что ответ заключается в том, что это возможно, когда . (Равенство может иметь место, если достигнуты супремум и инфимум: то есть они фактически являются максимумом и минимумом ) Когда либо либо , это условие не накладывает ограничений на , и тогда возможны все неотрицательные значения дисперсии.sup(X)=∞inf(X)=-∞r
Доказательство построено. Давайте начнем с простой версии, позаботимся о деталях и укажем основную идею, а затем перейдем к реальной конструкции.
Пусть будет в образе : это означает, что существует для которого . Определите функцию набора которая будет индикатором : то есть если и , когда .
Поскольку , очевидно, удовлетворяет первым двум аксиомам вероятности . Надо показать, что он удовлетворяет третьему; а именно, что это сигма-добавка. Но это почти так же очевидно: всякий раз, когда является конечным или счетно бесконечным множеством взаимоисключающих событий, то ни один из них не содержит - в этом случае для всех или ровно один из них содержит , и в этом случае для некоторого конкретного а в противном случае для всех, В любом случае
потому что обе стороны либо либо оба .
Поскольку концентрирует всю вероятность на , распределение концентрируется на и должен иметь нулевую дисперсию.
Пусть - два значения в диапазоне ; то есть и . Аналогично предыдущему шагу, определите меру которая будет средневзвешенным значением индикаторов и . Используйте неотрицательные веса и для определения . Как и прежде, мы находим, что - выпуклая комбинация мер индикатора, обсуждаемых в (1), - является вероятностной мерой. Распределение по этой мере является Бернуллираспределение, которое было масштабировано с помощью и смещено на . Поскольку дисперсия распределения Бернулли равна , дисперсия должна быть .
Непосредственным следствием (2) является то, что любой для которого существуют в диапазоне и для которого
может быть дисперсия . Поскольку , это подразумевает
с равенством, если и только если имеет максимум и минимум.
И наоборот, если превышает эту границу , то решение невозможно, поскольку мы уже знаем, что дисперсия любой ограниченной случайной величины не может превышать четверти квадрат его диапазона.
Да, такое распространение можно найти. Фактически вы можете взять любое распределение с конечной дисперсией и масштабировать в соответствии с вашими условиями, потому что
Например, равномерное распределение в интервале имеет дисперсию: Следовательно, равномерное распределение в интервале будет иметь дисперсию . [0,1
Фактически, это распространенный способ добавления параметров в некоторые дистрибутивы, такие как Student t. У него только один параметр - степени свободы. Когда распределение сходится к стандартному нормальному. Он имеет форму колокольчика и выглядит как нормальный, но имеет более толстые хвосты. Вот почему он часто используется в качестве альтернативы нормальному распределению, когда хвосты толстые. Единственная проблема состоит в том, что гауссово распределение имеет два параметра. Итак, приходит масштабированная версия Student t, которую иногда называют распределением « t location scale» . Это очень простое преобразование: , где - местоположение и масштаб. Теперь вы можете установить масштаб так, чтобы новая переменнаяν → ∞ ξ = t - μ μ,sξ будет иметь любую требуемую дисперсию и будет иметь форму распределения t студента.