Основано ли использование стандартного отклонения на предположении о нормальном распределении?


10

Мне интересно, было ли стандартное отклонение всегда построено в предположении нормального распределения. Другими словами, если выборка не распределяется нормально, следует ли считать использование стандартного отклонения ошибкой?


3
Равномерное распределение имеет стандартное отклонение, как это может быть «ошибкой»?

Ответы:


18

Нет. Использование стандартного отклонения не предполагает нормальности.

Дисперсия случайной величины определяется как . Пока существует дисперсия, стандартное отклонение также существует. Стандартное отклонение - это квадратный корень из дисперсии.Var(Икс)знак равноЕ[(Икс-Е[Икс])2]

Вы можете использовать дисперсию или стандартное отклонение в любое время, когда они существуют. Дисперсия возникает в бесчисленных ситуациях.Var(Икс)

Существуют специальные теоремы, леммы и т. Д. ... хотя для особого случая, когда следует нормальному распределению.Икс

Обычное использование стандартного отклонения, которое зависит от нормальности:

Если следует нормальному распределению, то существует приблизительно 95% вероятность того, что попадает в два стандартных отклонения от среднего.XИксИкс

Это утверждение верно, если следует нормальному распределению (и нескольким другим), но в общем случае оно неверно.Икс

Распространенное использование дисперсии, которая не зависит от нормальности:

Пусть - случайная величина со средним значением и дисперсией . Определим для , как независимых случайных величин, каждая из следующего за одинаковым распределением как .E [ X ] = μ Var ( X ) = σ 2 X i i = 1 , , n XИксЕ[Икс]знак равноμVar(Икс)знак равноσ2Иксяязнак равно1,...,NИкс

Определите выборочное среднее на основе наблюдений как: ˉ X n = 1N

Икс¯Nзнак равно1NΣязнак равно1NИкся

По центральной предельной теореме сходится к нормально распределенной случайной переменной со средним и дисперсией . (Точнее сходится по распределению к как .)μσ2Икс¯Nμσ2NN(Икс¯N-μ)N(0,σ2)N

Практическим следствием является то, что выборочное среднее при больших можно рассматривать как нормально распределенной случайной переменной, дисперсия является функцией дисперсии . (Вспомните ) И этот результат не требует, чтобы был нормальным. (Для правильной работы требуется меньшее если в некотором смысле ближе к нормальному распределению.)Икс¯NNσ2NИксVar(Икс)знак равноσ2ИксNИкс

Центральная предельная теорема является вездесущим инструментом, который использует дисперсию и не нуждается в чтобы следовать нормальному распределению.ИксИкс


4
Неравенство Чебышева не характерно для дисперсии: одинаково полезная версия существует для каждого абсолютного момента со степенью больше . Поэтому я бы предложил поискать в другом месте причины, по которым SD является важным и (почти) универсальным, например уникальную роль, которую играет дисперсия в центральной предельной теореме. 1
whuber

@whuber Да, я начал писать пример CLT (и теперь я добавил его). CLT - чрезвычайно практическая причина заботиться о дисперсии.
Мэтью Ганн

1
+1. Но обратите внимание, что хотя дисперсия (вместе со средним значением) дает полное описание в нормальном случае, для ненормального распределения это может быть уже не так, и другие d3-сценарии данных могут быть намного лучше
kjetil b halvorsen

2

S2σ^ML2Вaр[Икся]

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.