Что стандартное отклонение говорит нам в ненормальном распределении


40

В нормальном распределении правило 68-95-99.7 придает стандартному отклонению большой смысл, но что будет означать стандартное отклонение в ненормальном распределении (мультимодальное или перекошенное)? Будут ли все значения данных по-прежнему находиться в пределах 3 стандартных отклонений? Есть ли у нас правила типа 68-95-99.7 для ненормальных распределений?


16
Посмотрите на неравенство Чебышева .
COOLSerdash

@COOLSerdash отлично. Это прекрасно отвечает на мой вопрос.
Зухайб Али

3
Точка @ COOLSerdash здесь точная, но имейте в виду, что стандартное утверждение о неравенстве Чебышева относится к истинному SD, известному априори, а не к SD, оцененной по вашей выборке. Это может помочь прочитать эту превосходную ветку
gung - Восстановить Монику

Кроме того, вы, вероятно, не должны соглашаться на Чебышева сразу - вы, вероятно, можете сделать намного лучше, искажены или нет.
Стив С.

1
@ Gung так же, как правило 68-95-99.7!
Glen_b

Ответы:


12

Стандартное отклонение является одной конкретной мерой отклонения. Есть несколько других, средняя абсолютная девиация довольно популярна. Стандартное отклонение ни в коем случае не является особенным. Что делает его особенным, так это то, что распределение Гаусса является особенным.

Как отмечается в комментариях, неравенство Чебышева полезно для получения чувства. Однако есть другие .


9

Это квадратный корень второго центрального момента , дисперсии. Моменты связаны с характеристическими функциями (CF), которые называются характеристическими по той причине, что они определяют распределение вероятностей. Итак, если вы знаете все моменты, вы знаете CF, следовательно, вы знаете все распределение вероятностей.

Характеристическая функция нормального распределения определяется всего двумя моментами: средним и дисперсией (или стандартным отклонением). Поэтому для нормального распределения особенно важно стандартное отклонение, оно составляет 50% от его определения.

Для других распределений стандартное отклонение в некоторых отношениях менее важно, потому что у них есть другие моменты. Тем не менее, для многих дистрибутивов, используемых на практике, первые несколько моментов являются самыми большими, поэтому они являются наиболее важными из них, которые нужно знать.

Теперь, интуитивно, среднее говорит вам, где центр вашего распределения, а стандартное отклонение говорит вам, как близко к этому центру находятся ваши данные.

Поскольку стандартное отклонение выражено в единицах переменной, оно также используется для масштабирования других моментов для получения таких показателей, как эксцесс . Куртоз - это безразмерная метрика, которая показывает, насколько жирными являются хвосты вашего распределения по сравнению с нормой.


1
«Теперь, интуитивно, среднее говорит вам, где находится центр вашего распределения, а стандартное отклонение говорит вам, как близко к этому центру находятся ваши данные». - Разве это не применимо, только если распределение нормальное? В противном случае, чаще всего медиана является лучшим показателем центральной тенденции.
Дан Темкин

@DanTemkin При использовании медианы стандартное отклонение теряет свое значение до некоторой степени. Это рассчитывается от среднего. С медианой имеет смысл поговорить о квантилях, которые могут быть подходом для искаженных распределений. OP не фокусировался на перекосе. Таким образом, для любого симметричного распределения у вас есть среднее значение = медиана, оно не должно быть нормальным. Таким образом, имеет смысл говорить о среднем, когда обсуждается стандартное отклонение.
Аксакал

4

Стандартное отклонение выборки является мерой отклонения наблюдаемых значений от среднего значения в тех же единицах измерения данных. Нормальное распределение или нет.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.