Какая разница между дисперсией и стандартным отклонением?

127

Мне было интересно, какова разница между дисперсией и стандартным отклонением.

Если вы рассчитываете два значения, становится ясно, что вы получаете стандартное отклонение от дисперсии, но что это означает с точки зрения распределения, которое вы наблюдаете?

Кроме того, зачем вам стандартное отклонение?

variance mathematical-statistics standard-deviation

— Ле Макс
источник

1

stats.stackexchange.com/questions/118/…

— whuber

12

Вы, наверное, уже получили ответ. Тем не менее, эта ссылка имеет самое простое и лучшее объяснение. mathsisfun.com/data/standard-deviation.html

2

Стандартное отклонение полезно, поскольку значение находится в том же масштабе, что и данные, из которых оно было вычислено. Если измерять метры, стандартное отклонение будет метрами. Дисперсия, напротив, будет в квадрате метров.

— Владислав Довгальец

1

Стандартное отклонение может быть беспристрастным, но стандартное отклонение не может, потому что функция квадратного корня является нелинейной.

— Дакш Гаргас

85

Стандартное отклонение - это квадратный корень из дисперсии.

Стандартное отклонение выражается в тех же единицах, что и среднее значение, тогда как дисперсия выражается в квадратах, но для просмотра распределения вы можете использовать любой из них, если вы точно знаете, что используете. Например, нормальное распределение со средним значением = 10 и sd = 3 - это то же самое, что нормальное распределение со средним значением = 10 и дисперсией = 9.

— Питер Флом
источник

58

да, это математический способ объяснить эти два параметра, НО каково логическое объяснение? Почему мне действительно нужны два параметра, чтобы показать одно и то же (отклонение от среднего арифметического) ...

— Le Max

5

Тебе не нужны оба. Если вы сообщаете об одном, вам не нужно сообщать о другом

— Питер Флом

8

Нам нужны оба: стандартное отклонение хорошо для интерпретации, отчетности. Для развития теории дисперсия лучше.

— kjetil b halvorsen

4

Преимущество сообщения стандартного отклонения состоит в том, что оно остается в масштабе данных. Скажем, образец высоты для взрослых - в метрах, тогда стандартное отклонение также будет в метрах.

— Владислав Довгальец

5

@RushatRai При работе с суммами случайных величин дисперсии складываются вместе. Для независимых случайных величин

. Аналогичное выражение существует в общем случае без независимости (с исправлением с использованием ковариационных терминов). В целом, преобразование квадратного корня усложняет ситуацию и затрудняет аналитическую работу со стандартным отклонением.

V a r (\sum X_{i}) = \sum V a r (X_{i})

$Var(\sum X_i) = \sum Var(X_i)$

— Кнрумси

49

Вам не нужны оба. У каждого из них разные цели. SD обычно более полезен для описания изменчивости данных, в то время как дисперсия обычно намного полезнее математически. Например, сумма некоррелированных распределений (случайных величин) также имеет дисперсию, которая является суммой дисперсий этих распределений. Это не было бы верно для SD. С другой стороны, SD имеет удобство выражаться в единицах исходной переменной.

— Джон
источник

24

Если Джон ссылается на независимые случайные величины, когда говорит «несвязанные распределения», то его ответ правильный. Однако, чтобы ответить на ваш вопрос, есть несколько моментов, которые можно добавить:

Среднее значение и дисперсия являются двумя параметрами, которые определяют нормальное распределение.
$k$
$z$ $0$ $t$
$68\%$ $1$ $95.4\%$ $2$ $99\%$ $3$
Погрешность выражается в виде кратного стандартного отклонения оценки.
Дисперсия и смещение являются мерами неопределенности в случайной величине. Среднеквадратичная ошибка для оценки равна дисперсии + квадратное смещение.

— Майкл Черник
источник

4

Вы, вероятно, не должны говорить «натуральный параметр», который означает среднее значение, деленное на дисперсию, а 1 - на дисперсию: en.wikipedia.org/wiki/Natural_parameter

— Neil G

σ

$\sigma$

В пункте 3, не должно ли быть «стандартное отклонение используется для стандартизации статистики» вместо нормализации?

— Гарри

15

Дисперсия набора данных измеряет математическую дисперсию данных относительно среднего значения. Однако, хотя это значение теоретически правильно, его трудно применить в реальном смысле, потому что значения, использованные для его вычисления, были возведены в квадрат. Стандартное отклонение, поскольку квадратный корень из дисперсии дает значение в тех же единицах, что и исходные значения, что значительно упрощает работу и интерпретацию в сочетании с концепцией нормальной кривой.

— Hassan
источник

Это делает большую работу, объясняя почему в простых терминах.

— GWG

3

Еще один хороший момент, который следует сделать, - это то, что каждая метрика sd и var измеряет разброс переменной относительно среднего значения. Взятие квадратного корня из дисперсии для получения стандартного отклонения можно рассматривать как масштабный коэффициент, применяемый для возврата метрики обратно в единицы переменной.

— Мэтт Л.

6

С точки зрения распределения они эквивалентны (но, очевидно, не являются взаимозаменяемыми), но имейте в виду, что с точки зрения оценок это не так: квадратный корень оценки дисперсии НЕ является (несмещенной) оценкой стандартного отклонения. Только для умеренно большого количества выборок (и в зависимости от оценщиков) эти два сближаются. Для небольших размеров выборки вам необходимо знать параметрическую форму распределения для преобразования между ними, которая может стать слегка круглой.

— кварцевый
источник

4

При расчете дисперсии мы возводили в квадрат отклонения. Это означает, что если данные (наблюдения) приведены в метрах, они станут квадратными метрами. Надеюсь, это не правильное представление об отклонениях. Итак, мы снова квадратный корень (SD), который является ничем иным, как SD.

— г рави
источник