Моя интуиция заключается в том, что стандартное отклонение - это мера распространения данных.
У вас есть хорошая точка зрения, что то, является ли оно широким или жестким, зависит от того, каковы наши базовые предположения о распределении данных.
Предостережение: мера распространения наиболее полезна, когда распределение ваших данных симметрично относительно среднего значения и имеет дисперсию, относительно близкую к распределению нормального распределения. (Это означает, что это приблизительно нормально.)
В случае, когда данные являются приблизительно нормальными, стандартное отклонение имеет каноническую интерпретацию:
- Регион: выборочное среднее +/- 1 стандартное отклонение, содержит примерно 68% данных
- Регион: выборочное среднее +/- 2 стандартное отклонение, содержит примерно 95% данных
- Регион: выборочное среднее +/- 3 стандартного отклонения, содержит примерно 99% данных
(см. первый рисунок в вики )
Это означает, что если мы знаем, что среднее значение по населению равно 5, а стандартное отклонение равно 2,83, и мы предполагаем, что распределение примерно нормальное, я бы сказал, что я достаточно уверен, что если мы сделаем (большое) много наблюдений, только 5% быть меньше чем 0,4 = 5 - 2 * 2,3 или больше чем 9,6 = 5 + 2 * 2,3.
Обратите внимание, каково влияние стандартного отклонения на наш доверительный интервал? (чем больше разброс, тем больше неопределенности)
Кроме того, в общем случае, когда данные даже приблизительно не нормальны, но все еще симметричны, вы знаете, что существует некоторая для которой:α
- Регион: выборочное среднее +/- стандартное отклонение , содержит примерно 95% данныхα
Вы можете либо изучить из подвыборки, либо предположить, что и это часто дает вам хорошее практическое правило для расчета в своей голове, какие будущие наблюдения ожидать, или какие из новых наблюдений можно рассматривать как останцы. (помните об этом!)α = 2αα = 2
Я не понимаю, как вы должны это интерпретировать. Означает ли 2.83, что значения разбросаны очень широко, или они все тесно сгруппированы вокруг среднего ...
Я предполагаю, что каждый вопрос, задаваемый «широкий или жесткий», должен также содержать: «по отношению к чему?». Одним из предложений может быть использование известного дистрибутива в качестве ссылки. В зависимости от контекста может быть полезно подумать: «Это намного шире или плотнее, чем нормаль / пуассон?».
РЕДАКТИРОВАТЬ: На основе полезной подсказки в комментариях, еще один аспект о стандартном отклонении в качестве меры расстояния.
Еще одна интуиция полезности стандартного отклонения заключается в том, что это мера расстояния между выборочными данными и их средним значением :x 1 , … , x N ˉ xsNИкс1, … , ХNИкс¯
sN= 1NΣNя = 1( хя- х¯¯¯)2-------------√
Для сравнения, среднеквадратическая ошибка (MSE), одна из самых популярных мер ошибки в статистике, определяется как:
MSE = 1NΣNя = 1( Yя^- Yя)2
Могут возникнуть вопросы, почему вышеупомянутая функция расстояния? Почему квадратные расстояния, а не абсолютные расстояния, например? И почему мы берем квадратный корень?
Преимущество наличия квадратичного расстояния или ошибки состоит в том, что мы можем как дифференцировать, так и легко минимизировать их. Что касается квадратного корня, он добавляет к интерпретируемости, поскольку преобразует ошибку обратно в масштаб наших наблюдаемых данных.