Какая разница между дисперсией и стандартным отклонением?


127

Мне было интересно, какова разница между дисперсией и стандартным отклонением.

Если вы рассчитываете два значения, становится ясно, что вы получаете стандартное отклонение от дисперсии, но что это означает с точки зрения распределения, которое вы наблюдаете?

Кроме того, зачем вам стандартное отклонение?



12
Вы, наверное, уже получили ответ. Тем не менее, эта ссылка имеет самое простое и лучшее объяснение. mathsisfun.com/data/standard-deviation.html

2
Стандартное отклонение полезно, поскольку значение находится в том же масштабе, что и данные, из которых оно было вычислено. Если измерять метры, стандартное отклонение будет метрами. Дисперсия, напротив, будет в квадрате метров.
Владислав Довгальец

1
Стандартное отклонение может быть беспристрастным, но стандартное отклонение не может, потому что функция квадратного корня является нелинейной.
Дакш Гаргас

Ответы:


85

Стандартное отклонение - это квадратный корень из дисперсии.

Стандартное отклонение выражается в тех же единицах, что и среднее значение, тогда как дисперсия выражается в квадратах, но для просмотра распределения вы можете использовать любой из них, если вы точно знаете, что используете. Например, нормальное распределение со средним значением = 10 и sd = 3 - это то же самое, что нормальное распределение со средним значением = 10 и дисперсией = 9.


58
да, это математический способ объяснить эти два параметра, НО каково логическое объяснение? Почему мне действительно нужны два параметра, чтобы показать одно и то же (отклонение от среднего арифметического) ...
Le Max

5
Тебе не нужны оба. Если вы сообщаете об одном, вам не нужно сообщать о другом
Питер Флом

8
Нам нужны оба: стандартное отклонение хорошо для интерпретации, отчетности. Для развития теории дисперсия лучше.
kjetil b halvorsen

4
Преимущество сообщения стандартного отклонения состоит в том, что оно остается в масштабе данных. Скажем, образец высоты для взрослых - в метрах, тогда стандартное отклонение также будет в метрах.
Владислав Довгальец

5
@RushatRai При работе с суммами случайных величин дисперсии складываются вместе. Для независимых случайных величин . Аналогичное выражение существует в общем случае без независимости (с исправлением с использованием ковариационных терминов). В целом, преобразование квадратного корня усложняет ситуацию и затрудняет аналитическую работу со стандартным отклонением. Вaр(ΣИкся)знак равноΣВaр(Икся)
Кнрумси

49

Вам не нужны оба. У каждого из них разные цели. SD обычно более полезен для описания изменчивости данных, в то время как дисперсия обычно намного полезнее математически. Например, сумма некоррелированных распределений (случайных величин) также имеет дисперсию, которая является суммой дисперсий этих распределений. Это не было бы верно для SD. С другой стороны, SD имеет удобство выражаться в единицах исходной переменной.


24

Если Джон ссылается на независимые случайные величины, когда говорит «несвязанные распределения», то его ответ правильный. Однако, чтобы ответить на ваш вопрос, есть несколько моментов, которые можно добавить:

  1. Среднее значение и дисперсия являются двумя параметрами, которые определяют нормальное распределение.

  2. k

  3. z0T

  4. 68%195.4%299%3

  5. Погрешность выражается в виде кратного стандартного отклонения оценки.

  6. Дисперсия и смещение являются мерами неопределенности в случайной величине. Среднеквадратичная ошибка для оценки равна дисперсии + квадратное смещение.


4
Вы, вероятно, не должны говорить «натуральный параметр», который означает среднее значение, деленное на дисперсию, а 1 - на дисперсию: en.wikipedia.org/wiki/Natural_parameter
Neil G

σ

В пункте 3, не должно ли быть «стандартное отклонение используется для стандартизации статистики» вместо нормализации?
Гарри

15

Дисперсия набора данных измеряет математическую дисперсию данных относительно среднего значения. Однако, хотя это значение теоретически правильно, его трудно применить в реальном смысле, потому что значения, использованные для его вычисления, были возведены в квадрат. Стандартное отклонение, поскольку квадратный корень из дисперсии дает значение в тех же единицах, что и исходные значения, что значительно упрощает работу и интерпретацию в сочетании с концепцией нормальной кривой.


Это делает большую работу, объясняя почему в простых терминах.
GWG

3
Еще один хороший момент, который следует сделать, - это то, что каждая метрика sd и var измеряет разброс переменной относительно среднего значения. Взятие квадратного корня из дисперсии для получения стандартного отклонения можно рассматривать как масштабный коэффициент, применяемый для возврата метрики обратно в единицы переменной.
Мэтт Л.

6

С точки зрения распределения они эквивалентны (но, очевидно, не являются взаимозаменяемыми), но имейте в виду, что с точки зрения оценок это не так: квадратный корень оценки дисперсии НЕ является (несмещенной) оценкой стандартного отклонения. Только для умеренно большого количества выборок (и в зависимости от оценщиков) эти два сближаются. Для небольших размеров выборки вам необходимо знать параметрическую форму распределения для преобразования между ними, которая может стать слегка круглой.


4

При расчете дисперсии мы возводили в квадрат отклонения. Это означает, что если данные (наблюдения) приведены в метрах, они станут квадратными метрами. Надеюсь, это не правильное представление об отклонениях. Итак, мы снова квадратный корень (SD), который является ничем иным, как SD.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.