Что означает «беспристрастность»?


21
  • Что значит сказать, что «дисперсия является необъективной оценкой».
  • Что означает преобразование смещенной оценки в несмещенную оценку с помощью простой формулы. Что именно делает это преобразование?
  • Кроме того, какова практическая польза от этого преобразования? Вы конвертируете эти баллы при использовании определенного вида статистики?

Ответы:


22

Вы можете найти все здесь . Тем не менее, вот краткий ответ.

Пусть и - среднее значение и дисперсия интереса; Вы хотите оценить на основе выборки размера .σ 2 σ 2 nμσ2σ2n

Теперь допустим, что вы используете следующую оценку:

S2=1ni=1n(XiX¯)2 ,

где - оценка .μX¯=1ni=1nXiμ

Нетрудно (см. Сноску) увидеть, чтоE[S2]=n1nσ2 .

Поскольку , оценка S 2 называется смещенной.E[S2]σ2S2

Но заметьте, что . Поэтому ~ S 2=пE[nn1S2]=σ2- несмещенная оценкаσ2.S~2=nn1S2σ2

сноска

Начните с записи а затем разверните произведение ...(XiX¯)2=((Xiμ)+(μX¯))2

Изменить для учета ваших комментариев

Ожидаемое значение не дает σ 2 (и, следовательно, S 2 смещено), но оказывается, что вы можете преобразовать S 2 в ˜ S 2, так что ожидание действительно дает σ 2 .S2σ2S2S2S~2σ2

На практике часто предпочитают работать с вместо S 2 . Но, если n достаточно велико, это не большая проблема, так как nS~2S2n.nn11

Замечание Обратите внимание, что непредвзятость является свойством оценки, а не ожидания, как вы написали.


1
Я имею в виду больше в теоретическом плане. Я могу найти формулу в любой книге, но меня больше интересует объяснение словами. Ожидание сигмы непредвзято, и мы можем преобразовать оценку в ожидание?
выше

также я спрашиваю о практических аспектах этого, вы используете это преобразование при выполнении анализа?
выше

@ocram Что такое ? Это размер выборки? Или количество взятых образцов? Или оба? n
Quirik

@quirik: Предполагается, что взят один образец и он имеет размер n
ocram

@ocram Как тогда рассчитать ожидаемое значение дисперсии, если у нас есть один образец? Чего мне не хватает?
Quirik

6

Этот ответ проясняет ответ Окрама. Основная причина (и распространенное недоразумение) для заключается в том, что S 2 использует оценку ˉ X, которая сама оценивается по данным.E[S2]σ2S2X¯

Если вы проработаете вывод, вы увидите, что дисперсия этой оценки - это именно то, что дает дополнительную - σ 2E[(X¯μ)2] терминσ2n


5

Объяснение, которое дал @Ocram, великолепно. Чтобы объяснить то, что он сказал словами: если мы вычислим путем деления только на n (что интуитивно понятно), наша оценка s 2 будет занижена. Чтобы компенсировать это, мы делим на n - 1 .s2ns2n1

Вот упражнение: Составьте дискретную вероятность с 2 исходами, скажем, и P ( 6 ) = .75 . Найти µ и σ для этого распределения. Рассчитайте µ и σ для среднего значения для образца, когда n = 3 . Рассчитайте все возможные выборки размером n = 3 . Рассчитайте s 2 по этим выборкам и примените соответствующие частоты. P(2)=.25P(6)=.75μσμσn=3n=3s2

Иногда тебе нужно запачкать руки.


Спасибо за вашу помощь. Несколько вопросов: В вашем упражнении: на какой тип дистрибутива вы ссылаетесь, Binomial? Что вы имеете в виду, чтобы сделать дискретную вероятность? Вы хотите рассчитать все вероятности 2 и 6 для разных размеров выборки?
выше

1

Обычно использование «n» в знаменателе дает меньшие значения, чем дисперсия населения, что мы и хотим оценить. Особенно это происходит, если брать маленькие образцы. На языке статистики мы говорим, что выборочная дисперсия дает «смещенную» оценку дисперсии населения и должна быть «беспристрастной».

Это видео ответит на каждую часть вашего вопроса адекватно.

https://www.youtube.com/watch?v=xslIhnquFoE

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.