Поскольку цель здесь, по-видимому, заключается в получении некоторой достоверной и полезной оценки , предварительное распределение должно соответствовать спецификации распределения населения, из которого происходит выборка. Это никоим образом не означает, что мы «вычислим» предшествующее использование самого образца - это сведет на нет действительность всей процедуры. Мы действительно знаем, что совокупность, из которой происходит выборка, представляет собой совокупность одинаковых случайных величин, каждая из которых находится в диапазоне . Это предположение поддерживается и является частью предшествующей информации, которой мы обладаем (и она не имеет ничего общего с выборкой , то есть с конкретной реализацией подмножества этих случайных переменных).θ[0,θ]
Теперь предположим, что эта совокупность состоит из случайных величин (в то время как наша выборка состоит из реализаций случайных величин). Поддерживаемое предположение говорит нам, что
mn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
Обозначим для компактности . Тогда у нас есть который также может быть записан как
maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
Функция плотности из из IID Равномерное с.в. в диапазоне является
maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
для поддержки и ноль в другом месте. Затем, используя и применяя формулу изменения переменной, мы получаем предварительное распределение для , которое согласуется с поддерживаемым предположением:
[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
что может быть неправильно, если мы не укажем константу соответствующим образом. Но наш интерес заключается в том, чтобы иметь правильную апостериор для , а также мы не хотим ограничивать возможные значения (за исключением ограничения, подразумеваемого поддерживаемым предположением). Таким образом , мы выходим неопределенными.
Затем, написав апостериорныйcθθc
X={x1,..,xn}
f(θ∣X)∝θ−NNcNθ−1⇒f(θ∣X)=ANcNθ−(N+1)
для некоторой нормализующей константы A. Мы хотим
∫Sθf(θ∣X)dθ=1⇒∫∞x∗ANcNθ−(N+1)dθ=1
⇒ANcN1−Nθ−N∣∣∞x∗=1⇒A=(cx∗)N
Вставка в заднюю часть
f(θ∣X)=(cx∗)NNcNθ−(N+1)=N(x∗)Nθ−(N+1)
Обратите внимание, что неопределенная константа предыдущего распределения удобно удаляется.c
Апостериор суммирует всю информацию, которую конкретный образец может дать нам относительно значения . Если мы хотим получить конкретное значение для мы можем легко рассчитать ожидаемое значение апостериора,
θθ
E(θ∣X)=∫∞x∗θN(x∗)Nθ−(N+1)dθ=−NN−1(x∗)Nθ−N+1∣∣∞x∗=NN−1x∗
Есть ли интуиция в этом результате? Что ж, по мере того, как число увеличивается, более вероятно, что максимальная реализация среди них будет все ближе и ближе к их верхней границе, - что в точности соответствует последнему среднему значению : если, скажем, , , но если , Это показывает, что наша тактика в отношении выбора предыдущего была разумной и соответствовала рассматриваемой проблеме, но не обязательно «оптимальной» в некотором смысле.XθθN=2⇒E(θ∣X)=2x∗N=10⇒E(θ∣X)=109x∗