Каковы некоторые иллюстративные применения эмпирической вероятности?

Я слышал об эмпирической вероятности Оуэна, но до недавнего времени не обращал на это внимания, пока не наткнулся на интересную статью ( Mengersen et al. 2012 ).

В моих попытках понять это я выяснил, что вероятность наблюдаемых данных представляется в виде

L знак равно \underset{я}{Π} п_{я} знак равно \underset{я}{Π} п ({Икс}_{я} знак равно Икс) знак равно \underset{я}{Π} п ({Икс}_{я} \leq Икс) - п ({Икс}_{я} < Икс)

$L = \prod_i p_i = \prod_i P(X_i=x) = \prod_i P(X_i \le x) - P(X_i \lt x)$ , где и .

\sum_{i} p_{i} = 1

$\sum_i p_i = 1$

p_{i} > 0

$p_i > 0$

Однако мне не удалось совершить мысленный скачок, связывающий это представление с тем, как его можно использовать для заключения о наблюдениях. Возможно, я слишком укоренен в мысли о вероятности относительно параметров модели?

Несмотря на это, я искал в Google Scholar некоторую бумагу, использующую эмпирическую вероятность, которая помогла бы мне усвоить концепцию ... безрезультатно. Очевидно, что есть книга Арт Оуэна об Эмпирическом правдоподобии , но в Google Книгах пропущены все вкуснятины, и я все еще нахожусь в медленном процессе получения межбиблиотечного кредита.

В то же время, может ли кто-нибудь любезно указать мне на документы и документы, которые ясно иллюстрируют предпосылку эмпирической вероятности и как она используется? Иллюстративное описание самого EL также приветствуется!

— Самир
источник

Эконометрики, в частности, влюбились в ЭЛ. Если вы ищете приложения , эта литература может быть одним из лучших мест для поиска.

— кардинал

Ответы:

Я не могу придумать лучшего места, чем книга Оуэна, чтобы узнать об эмпирической вероятности.

Один практический способ думать о - это вероятность многочленного распределения по наблюдаемым точкам данных . Таким образом, вероятность является функцией вектора вероятности , пространство параметров на самом деле является мерным симплексом векторов вероятности, и MLE помещает вес $L = L(p_1, \ldots, p_n)$ $x_1, \ldots, x_n$ $(p_1, \ldots, p_n)$ $n$ $1/n$ на каждом из наблюдений (предположим, что они все разные). Размерность пространства параметров увеличивается с увеличением количества наблюдений.

Центральным моментом является то, что эмпирическое правдоподобие дает метод для вычисления доверительных интервалов путем профилирования без указания параметрической модели. Если интересующим параметром является среднее значение, , то для любого вектора вероятности мы имеем среднее значение и мы может вычислить вероятность профиля как $\mu$ $p = (p_1, \ldots, p_n)$

μ (п) знак равно Σ_{я знак равно 1}^{N} {Икс}_{я} п_{я},

$\mu(p) = \sum_{i=1}^n x_i p_i,$

Тогда мы можем вычислить доверительные интервалы вида

. Здесь

- эмпирическое среднее, а

L_{профессор} (μ) знак равно Максимум {L (п) | μ (п) знак равно μ},

$L_{\text{prof}}(\mu) = \max \{ L(p) \mid \mu(p) = \mu \}.$

я_{р} знак равно {μ | L_{профессор} (μ) \geq р L_{профессор} (\bar{Икс})}

$I_r = \{ \mu \mid L_{\text{prof}}(\mu) \geq r L_{\text{prof}}(\bar{x}) \}$

r \in (0, 1)

$r \in (0,1)$

\bar{x}

$\bar{x}$

. Интервалы

возможно, следует просто называть (профильными) интервалами правдоподобия, поскольку никаких заявлений об охвате не делается заранее. С уменьшением

интервалы

(да, это интервалы) образуют вложенное, увеличивающееся семейство доверительных интервалов. Скажем, асимптотическую теорию или бутстрап можно использовать для калибровки

для достижения охвата 95%.

L_{prof} (\bar{x}) = n^{- n}

$L_{\text{prof}}(\bar{x}) = n^{-n}$

I_{r}

$I_r$

r

$r$

I_{r}

$I_r$

r

$r$

Книга Оуэна подробно описывает это и предоставляет расширения для более сложных статистических задач и других представляющих интерес параметров.

— NRH
источник

(+1) Не имея доступа к книге, всегда можно начать с оригинальных статей, чтобы получить основы теории. Как и в книге, документы также довольно четко написаны.

— кардинал

Некоторые ссылки: ( 1 ) A. Owen (1988), Эмпирические доверительные интервалы отношения правдоподобия для одного функционала , Biometrika , vol. 75, No. 2, pp. 237-249, ( 2 ) A. Owen (1990), Эмпирическое доверительное отношение вероятности , Ann. Statist. том 18, нет 1, с. 90-120 ( открытый доступ ) и ( 3 ) А. Оуэн (1991). Эмпирическая вероятность линейных моделей , Ann. Statist. том 19, нет. 4, с. 1725-1747 ( открытый доступ ).

— кардинал

@ Cardinal Фантастический! Должен был подумать об этом сам.

— Самир

@NHS Спасибо за ваше объяснение! Просто чтобы быть ясно, является

WRT

«ы? Кроме того, можете ли вы объяснить, почему

? Должно ли это быть

L_{p r o f} (μ)

$L_{prof}(\mu)$

a r g m a x

$argmax$

p

$p$

L_{p r o f} (\bar{x}) = n^{n}

$L_{prof}(\bar{x})=n^n$

\prod_{i} n^{- 1} = n^{- n}

$\prod_i n^{-1} = n^{-n}$

— Самер

@Sameer, опечатка исправлена. Однако это не argmax. Это вероятность профиля, полученная путем максимизации вероятности по всем векторам параметров с заданным значением

. Кстати, при подходящем поступлении в университет я получил электронную версию CRC отдельных глав книги Оуэна.

μ

$\mu$

— NRH

E [g (X, θ)] = 0

$E[g(X,\theta)] = 0$

X

$X$

g

$g$

q

$q$

θ \in Θ \subseteq R^{p}

$\theta \in \Theta \subseteq \mathbb{R}^p$

q \geq p

$q \geq p$

g

$g$

θ

$\theta$

{\hat{θ}}_{GMM} = {argmin}_{θ \in Θ} {\bar{g}}_{n} (θ)^{'} W {\bar{g}}_{n} (θ)

$\hat{\theta}_\text{GMM} = \text{argmin}_{\theta \in \Theta} \; \bar{g}_n(\theta) 'W \bar{g}_n(\theta)$

W

$W$

{\bar{g}}_{n} (θ) := \frac{1}{n} \sum_{i = 1}^{n} g (X_{i}, θ) .

$\bar{g}_n(\theta) := \frac{1}{n} \sum_{i=1}^n g(X_i,\theta).$

θ

$\theta$

L (θ) = max_{p_{1}, \dots, p_{n}} \prod_{i = 1}^{n} p_{i}

$L(\theta) = \max_{p_1,\ldots,p_n} \; \prod_{i=1}^n p_i$

\sum_{i = 1}^{n} p_{i} = 1, p_{i} \geq 0, \sum_{i = 1}^{n} p_{i} \cdot g (X_{i}, θ) = 0.

$\sum_{i=1}^n p_i=1, \qquad p_i \geq 0, \qquad \sum_{i=1}^n p_i \cdot g(X_i,\theta) = 0.$

θ

$\theta$

{\hat{θ}}_{EL} = {argmax}_{θ \in Θ} \log L (θ) .

$\hat{\theta}_\text{EL} = \text{argmax}_{\theta \in \Theta} \; \log L(\theta).$

Конечно, есть много других причин, по которым EL привлекла внимание эконометрикой, но я надеюсь, что это полезная отправная точка. Модели равенства моментов очень распространены в эмпирической экономике.

— Aelmore
источник

Спасибо за то, что написали такой четкий, хороший ответ. Добро пожаловать в наше сообщество!

— whuber

$S(t) = Pr(T > t)$ $T$ $\hat{S}$

— ocram
источник