Смещение оценки момента логнормального распределения

Я делаю некоторый численный эксперимент, который состоит в выборке логнормального распределения $X\sim\mathcal{LN}(\mu, \sigma)$ и попытке оценить моменты $\mathbb{E}[X^n]$ двумя методами:

Глядя на выборку среднего значения $X^n$
Оценивая $\mu$ и $\sigma^2$ , используя выборочные средние для $\log(X), \log^2(X)$ , а затем используя тот факт, что для логнормального распределения имеем $\mathbb{E}[X^n]=\exp(n \mu + (n \sigma)^2/2)$ .

Вопрос в следующем :

Я нахожу экспериментально, что второй метод работает намного лучше, чем первый, когда я фиксирую количество выборок и увеличиваю $\mu, \sigma^2$ на некоторый фактор Т. Есть ли какое-то простое объяснение этому факту?

Я прилагаю фигуру, на которой ось X - это T, а ось Y - это значения $\mathbb{E}[X^2]$ сравнивающие истинные значения $\mathbb{E}[X^2] = \exp(2 \mu + 2 \sigma^2)$ (оранжевый линия), к оценочным значениям. метод 1 - синие точки, метод 2 - зеленые точки. Ось Y в логарифмическом масштабе

$Истинные и оценочные значения для $ \ mathbb {E} [X ^ 2] $. Синие точки - примерные значения для $ \ mathbb {E} [X ^ 2] $ (метод 1), в то время как зеленые точки - это оценочные значения с использованием метода 2. Оранжевая линия рассчитывается по известным $ \ mu $, $ \ sigma $ по тому же уравнению, что и в методе 2. Ось Y находится в логарифмическом масштабе$

РЕДАКТИРОВАТЬ:

Ниже приведен минимальный код Mathematica для получения результатов для одного T с выводом:

   ClearAll[n,numIterations,sigma,mu,totalTime,data,rmomentFromMuSigma,rmomentSample,rmomentSample]
(* Define variables *)
n=2; numIterations = 10^4; sigma = 0.5; mu=0.1; totalTime = 200;
(* Create log normal data*)
data=RandomVariate[LogNormalDistribution[mu*totalTime,sigma*Sqrt[totalTime]],numIterations];

(* the moment by theory:*)
rmomentTheory = Exp[(n*mu+(n*sigma)^2/2)*totalTime];

(*Calculate directly: *)
rmomentSample = Mean[data^n];

(*Calculate through estimated mu and sigma *)
muNumerical = Mean[Log[data]]; (*numerical \[Mu] (gaussian mean) *)
sigmaSqrNumerical = Mean[Log[data]^2]-(muNumerical)^2; (* numerical gaussian variance *)
rmomentFromMuSigma = Exp[ muNumerical*n + (n ^2sigmaSqrNumerical)/2];

(*output*)
Log@{rmomentTheory, rmomentSample,rmomentFromMuSigma}

Выход:

(*Log of {analytic, sample mean of r^2, using mu and sigma} *)
{140., 91.8953, 137.519}

выше, вторым результатом является среднее значение выборки , которое ниже двух других результатов $r^2$

— user29918
источник

Несмещенная оценка не означает, что синие точки должны быть около ожидаемого значения (оранжевая кривая). Оценщик может быть беспристрастным, если он имеет высокую вероятность быть слишком низким и малую (возможно, исчезающе маленькую) вероятность быть слишком высокой. Это то, что происходит, когда T увеличивается, и дисперсия становится огромной (см. Мой ответ).

— Мэтью Ганн

Чтобы узнать, как получить объективные оценки, см. Stats.stackexchange.com/questions/105717 . UMVUE среднего и дисперсии приведены в ответах и комментариях к ним.

— whuber

Ответы:

Есть что-то загадочное в этих результатах, так как

первый метод дает объективную оценку , а именно $\mathbb{E}[X^2]$ имееткачестве среднего значения. Следовательно, синие точки должны быть около ожидаемого значения (оранжевая кривая); $\frac{1}{N} Σ_{я знак равно 1}^{N} {Икс}_{я}^{2}$ $\frac{1}{N}\sum_{i=1}^N X_i^2$ $\mathbb{E}[X^2]$
второй способ обеспечивает смещенной оценкой , а именно $\mathbb{E}[X^2]$ , когда и являются несмещенные оценки из и $Е [ехр (N \hat{μ} + N^{2} {\hat{σ}}^{2} / 2)] > ехр (N μ + (N σ)^{2} / 2)$ $\mathbb{E}[\exp(n \hat\mu + n^2 \hat{\sigma}^2/2)]>\exp(n \mu + (n \sigma)^2/2)$ $\hat\mu$ $\hat\sigma²$ $\mu$ $\sigma²$ соответственно, и поэтому странно, что зеленые точки выровнены с оранжевой кривой.

$\mu_T$ $\sigma_T$

Вот соответствующий код R:

moy1=moy2=rep(0,200)
mus=0.14*(1:200)
sigs=sqrt(0.13*(1:200))
tru=exp(2*mus+2*sigs^2)
for (t in 1:200){
x=rnorm(1e5)
moy1[t]=mean(exp(2*sigs[t]*x+2*mus[t]))
moy2[t]=exp(2*mean(sigs[t]*x+mus[t])+2*var(sigs[t]*x+mus[t]))}

plot(moy1/tru,col="blue",ylab="relative mean",xlab="T",cex=.4,pch=19)
abline(h=1,col="orange")
lines((moy2/tru),col="green",cex=.4,pch=19)

$\mu$ $\sigma$ $\mu$ $\sigma$

$\mathbb{E}[X^2]$ $X^2$ $X^2$ $e^{2\mu}$ $X^2$ $\exp\{2\mu+2\sigma\epsilon\}$ $\epsilon\sim\mathcal{N}(0,1)$ $\sigma$ $\sigma\epsilon$ $\sigma^2$ $X$ $\mathcal{LN}(\mu,\sigma)$
$\begin{aligned} п ({Икс}^{2} > Е [{Икс}^{2}]) & знак равно п (журнал {{Икс}^{2}} > 2 μ + 2 σ^{2}) \\ знак равно п (μ + σ ε > μ + σ^{2}) \\ знак равно п (ε > σ) \\ знак равно 1 - Φ (σ) \end{aligned}$ $\begin{align*}\mathbb{P}(X^2>\mathbb{E}[X^2])&=\mathbb{P}(\log\{X^2\}>2\mu+2\sigma^2)\\&=\mathbb{P}(\mu+\sigma\epsilon>\mu+\sigma^2)\\&=\mathbb{P}(\epsilon>\sigma)\\ &=1-\Phi(\sigma)\end{align*}$

— Сиань
источник

Я также озадачен. Я добавляю минимальный код с результатами (Mathematica)

— user29918

Хорошо. Благодарность! Сложив некоторые цифры, я вижу, что мой скудный размер выборки действительно не подходит для этой задачи!

— user29918

σ

$\sigma$

P (X^{2} > E [X^{2}]) = 1 - Φ (σ)

$P(X^2 > \mathbb{E}[X^2]) = 1 - \Phi(\sigma)$

σ

$\sigma$

σ

$\sigma$

Этот тип асимптотики не очень полезен, так как количество симуляций, необходимых для правильной аппроксимации моментов, растет экспоненциально быстро с

σ

$\sigma$

Я подумал, что подброшу несколько фиг, показывающих, что графики user29918 и Сианя совпадают. На рис. 1 показано, что сделал user29918, а на рис. 2 (на основе тех же данных) - то, что сделал Сиань для своего сюжета. Тот же результат, другая презентация.

$\frac{1}{n} \sum_i x_i^2$

Дальнейшие комментарии:

Беспристрастная оценка не означает, что оценка должна быть близка! Синие точки не обязательно должны соответствовать ожиданиям. Например. одно случайное наблюдение, выбранное случайным образом, дает объективную оценку среднего значения по населению, но не следует ожидать, что эта оценка будет близкой.
Проблема поднимается, поскольку дисперсия становится абсолютно астрономической. Поскольку дисперсия становится все более очевидной, оценка для первого метода сводится к нескольким наблюдениям. Вы также начинаете иметь крошечную, крошечную вероятность БЕЗУМНО, БЕЗУМНО, БЕЗУМНО большого числа ...
$P(X^2 > E[X^2]) = 1 - \Phi(\sigma)$ $\sigma$ $X^2 > E[X^2]$ .

— Мэтью Ганн
источник