Я не уверен, что это чисто американский или британский вопрос. Остальная часть этой страницы взята из FAQ, который я написал ( http://www.graphpad.com/faq/viewfaq.cfm?faq=1383 ).
Как вычислить SD с n-1 в знаменателе
Вычислите квадрат разности между каждым значением и значением выборки.
Добавьте эти значения вверх.
Разделите сумму на n-1. Результат называется дисперсией.
Возьмите квадратный корень, чтобы получить стандартное отклонение.
Почему н-1?
Зачем делить на n-1, а не n при вычислении стандартного отклонения? На шаге 1 вы вычисляете разницу между каждым значением и средним значением этих значений. Вы не знаете истинного среднего значения населения; все, что вы знаете, это среднее значение вашего образца. За исключением редких случаев, когда среднее значение выборки оказывается равным среднему значению для популяции, данные будут ближе к среднему значению для выборки, чем к истинному среднему значению для популяции. Таким образом, значение, которое вы вычисляете на шаге 2, вероятно, будет немного меньше (и не может быть больше), чем это было бы, если бы вы использовали истинное среднее значение на шаге 1. Чтобы восполнить это, разделите на n-1, а чем Н.В. Это называется коррекция Бесселя.
Но почему н-1? Если вы знали среднее значение выборки и все значения, кроме одного, вы могли бы рассчитать, каким должно быть это последнее значение. Статистики говорят, что существует n-1 степеней свободы.
Когда следует вычислять SD с помощью знаменателя n вместо n-1?
В статистических книгах часто приводятся два уравнения для вычисления SD: одно с использованием n, а другое с использованием n-1 в знаменателе. Некоторые калькуляторы имеют две кнопки.
Уравнение n-1 используется в общей ситуации, когда вы анализируете выборку данных и хотите сделать более общие выводы. SD, рассчитанная таким образом (с n-1 в знаменателе), является вашей лучшей оценкой значения SD в общей популяции.
Если вы просто хотите количественно оценить вариацию в конкретном наборе данных и не планируете экстраполировать, чтобы сделать более широкие выводы, то вы можете вычислить SD, используя n в знаменателе. В результате SD является SD этих конкретных значений. Нет смысла вычислять SD таким образом, если вы хотите оценить SD населения, из которого были получены эти точки. Использовать n в знаменателе имеет смысл только тогда, когда нет выборки из совокупности, нет желания делать общие выводы.
Цель науки - почти всегда обобщать, поэтому не следует использовать уравнение с n в знаменателе. Единственный пример, который я могу придумать, где это может иметь смысл, - это количественная оценка различий между результатами экзаменов. Но гораздо лучше было бы показать диаграмму рассеяния каждой оценки или гистограмму распределения частот.