Почему квадратный корень взят для выборки «N» в формуле стандартного отклонения?


9

Я пытаюсь понять очень основную концепцию стандартного отклонения.

Из формулыσ=i=1n(xiμ)2N

Я не могу понять, почему мы должны вдвое сократить население "N", то есть, почему мы хотим взять когда мы не делали ? Разве это не искажает население, которое мы рассматриваем? N 2NN2

Не должно быть формулой:σ=i=1n(xiμ)2N

Ответы:


10

Вы пытаетесь найти «типичное» отклонение от среднего.

Дисперсия - это «среднеквадратичное расстояние от среднего».

Стандартное отклонение является квадратным корнем этого.

Это делает его среднеквадратичным отклонением от среднего.

  1. Зачем нам использовать среднеквадратичное отклонение? Что делает дисперсию интересной? Помимо прочего, из-за основного факта о дисперсиях, что дисперсия суммы некоррелированных переменных является суммой отдельных дисперсий. (Это рассматривается в ряде вопросов, например, здесь, в CrossValidated. Эта удобная функция не разделяется, например, средним абсолютным отклонением.
  2. Зачем брать квадратный корень из этого? Потому что тогда он в тех же единицах, что и исходные наблюдения. Он измеряет определенный тип «типичного расстояния» от среднего значения (как уже упоминалось, среднеквадратичное расстояние), но из-за вышеупомянутого свойства дисперсии, которое имеет некоторые приятные особенности.

7

Стандартное отклонение представляет собой квадратный корень из дисперсии .

Дисперсия - это среднее квадратическое расстояние данных от среднего. Поскольку среднее - это сумма, деленная на количество суммируемых элементов, формула для дисперсии: Так как стандартное отклонение, опять же, является просто квадратным корнем из этого, формула для стандартного отклонения: Ничего не было добавлено или изменено предположения или дисперсия здесь, мы просто взяли квадратный корень из дисперсии, потому что это то , что стандартное отклонение это .
S.D. (X)=

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

возможно, следует отметить, что эта формула дисперсии верна только для дискретных униформ. иначе это могло бы спутать различие между выборкой и дисперсией населения
Тейлор

@ Тейлор, я не знаю, что ты имеешь в виду. Формула для дисперсии не связана с распределением.
gung - Восстановить Монику

формула для (выборочной) дисперсии не связана с распределением ( en.wikipedia.org/wiki/Expected_value#Definition )
Тейлор,

@ Тейлор, я до сих пор не знаю, что ты имеешь в виду. Формула для дисперсии не связана с распределением. Процитируем со страницы Википедии: «Дисперсия случайной величины X является ожидаемым значением квадрата отклонения от среднего значения X ... . Это определение включает в себя случайные переменные, которые генерируются дискретными, непрерывными, либо смешанными процессами ». Формула верна не только для дискретной униформы. Var(X)=E[(Xμ)2]
gung - Восстановить Монику

Да, правильно, если вы берете , но не обязательно равно для любой случайной величины , . С одной стороны, первая является константой, а вторая - случайной. На самом деле не ясно, превышает ли сумма поддержку или количество выборок. Если последнее, то странно, что вы знаете , что редко встречается на практике. Если первое, то да, это верно только для дискретных (потому что это сумма) униформ (потому что все веса одинаковы). μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
Тейлор

1

Первое, что нужно понять, это то, что стандартное отклонение (стандартное отклонение) отличается от среднего абсолютного отклонения . Эти два определяют разные математические свойства данных.

В отличие от среднего абсолютного отклонения, стандартное отклонение (стандартное отклонение) весит больше значений, которые далеки от среднего, что достигается путем возведения в квадрат значений разности.

Например, для следующих четырех точек данных:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

среднее абсолютное отклонение (aad) и=16/4=4.0

Стандартное отклонение (стандартное отклонение) =80/4=20=4.47

В данных есть две точки, которые находятся на расстоянии 6 от среднего значения, и две точки, которые находятся на расстоянии 2 от среднего значения. Таким образом, отклонение 4,47 имеет больше смысла, чем 4.

Поскольку общее наблюдение всегда , для вычисления стандартного отклонения мы не погружаемся на , вместо этого мы делим общую дисперсию на и берем ее квадратный корень, чтобы привести ее к той же единице, что и исходные данные.NNN


0

@Mahesh Subramaniya - это просто математический поворот . Когда у нас есть первоначальное значение, например, . Мы можем получить одно и то же значение, используя эти два уравнения и .a 2b = c a/b=()da2b=ccb=d

Например, просто сделайте это с = . Но мы хотим только ценность, а не минус. - 2,5522.5

Теперь . И522=12.512.52=2.5

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.