Что означает «беспристрастность»?

21

Что значит сказать, что «дисперсия является необъективной оценкой».
Что означает преобразование смещенной оценки в несмещенную оценку с помощью простой формулы. Что именно делает это преобразование?
Кроме того, какова практическая польза от этого преобразования? Вы конвертируете эти баллы при использовании определенного вида статистики?

theory unbiased-estimator descriptive-statistics

22

Вы можете найти все здесь . Тем не менее, вот краткий ответ.

Пусть и - среднее значение и дисперсия интереса; Вы хотите оценить на основе выборки размера . $\mu$ $\sigma^2$ $\sigma^2$ $n$

Теперь допустим, что вы используете следующую оценку:

$S^2 = \frac{1}{n} \sum_{i=1}^n (X_{i} - \bar{X})^2$ ,

где - оценка . $\bar{X} = \frac{1}{n} \sum_{i=1}^n X_i$ $\mu$

Нетрудно (см. Сноску) увидеть, что $E[S^2] = \frac{n-1}{n}\sigma^2$ .

Поскольку , оценка называется смещенной. $E[S^2] \neq \sigma^2$ $S^2$

Но заметьте, что . Поэтому $E[\frac{n}{n-1} S^2] = \sigma^2$ - несмещенная оценка. $\tilde{S}^2 = \frac{n}{n-1} S^2$ $\sigma^2$

сноска

Начните с записи а затем разверните произведение ... $(X_i - \bar{X})^2 = ((X_i - \mu) + (\mu - \bar{X}))^2$

Изменить для учета ваших комментариев

Ожидаемое значение не дает (и, следовательно, смещено), но оказывается, что вы можете преобразовать в так что ожидание действительно дает . $S^2$ $\sigma^2$ $S^2$ $S^2$ $\tilde{S}^2$ $\sigma^2$

На практике часто предпочитают работать с вместо . Но, если достаточно велико, это не большая проблема, так как $\tilde{S}^2$ $S^2$ $n$ . $\frac{n}{n-1} \approx 1$

Замечание Обратите внимание, что непредвзятость является свойством оценки, а не ожидания, как вы написали.

— ocram
источник

1

Я имею в виду больше в теоретическом плане. Я могу найти формулу в любой книге, но меня больше интересует объяснение словами. Ожидание сигмы непредвзято, и мы можем преобразовать оценку в ожидание?

— выше

также я спрашиваю о практических аспектах этого, вы используете это преобразование при выполнении анализа?

— выше

@ocram Что такое

? Это размер выборки? Или количество взятых образцов? Или оба?

n

$n$

— Quirik

@quirik: Предполагается, что взят один образец и он имеет размер n

— ocram

@ocram Как тогда рассчитать ожидаемое значение дисперсии, если у нас есть один образец? Чего мне не хватает?

— Quirik

6

Этот ответ проясняет ответ Окрама. Основная причина (и распространенное недоразумение) для заключается в том, что использует оценку которая сама оценивается по данным. $E[S^2] \neq \sigma^2$ $S^2$ $\bar{X}$

Если вы проработаете вывод, вы увидите, что дисперсия этой оценки - это именно то, что дает дополнительную $E[(\bar{X}-\mu)^2]$ термин $-\frac{\sigma^2}{n}$

— жесткий
источник

5

Объяснение, которое дал @Ocram, великолепно. Чтобы объяснить то, что он сказал словами: если мы вычислим путем деления только на (что интуитивно понятно), наша оценка будет занижена. Чтобы компенсировать это, мы делим на . $s^2$ $n$ $s^2$ $n-1$

Вот упражнение: Составьте дискретную вероятность с 2 исходами, скажем, и . Найти и для этого распределения. Рассчитайте и для среднего значения для образца, когда . Рассчитайте все возможные выборки размером . Рассчитайте по этим выборкам и примените соответствующие частоты. $P(2) = .25$ $P(6) = .75$ $\mu$ $\sigma$ $\mu$ $\sigma$ $n = 3$ $n =3$ $s^2$

Иногда тебе нужно запачкать руки.

— Адам
источник

Спасибо за вашу помощь. Несколько вопросов: В вашем упражнении: на какой тип дистрибутива вы ссылаетесь, Binomial? Что вы имеете в виду, чтобы сделать дискретную вероятность? Вы хотите рассчитать все вероятности 2 и 6 для разных размеров выборки?

— выше

1

Обычно использование «n» в знаменателе дает меньшие значения, чем дисперсия населения, что мы и хотим оценить. Особенно это происходит, если брать маленькие образцы. На языке статистики мы говорим, что выборочная дисперсия дает «смещенную» оценку дисперсии населения и должна быть «беспристрастной».

Это видео ответит на каждую часть вашего вопроса адекватно.

https://www.youtube.com/watch?v=xslIhnquFoE

— Сахил Чаудхари
источник