Как мне оценить стандартное отклонение?


15

Я собрал ответы от 85 человек об их способности выполнять определенные задачи.

Ответы по пятибалльной шкале Лайкерта:

5 = очень хорошо, 4 = хорошо, 3 = средний, 2 = плохо, 1 = очень плохо,

Средний балл составляет 2,8, а стандартное отклонение - 0,54.

Я понимаю, что означает среднее и стандартное отклонение.

Мой вопрос: насколько хорошо (или плохо) это стандартное отклонение?

Другими словами, существуют ли какие-либо рекомендации, которые могут помочь в оценке стандартного отклонения.


Что бы это значило для SD, чтобы быть хорошим или плохим здесь?
gung - Восстановить Монику

7
Довольно сложно получить такой маленький SD с данными, подобными этим: для среднего значения 2,8 SD должно быть по крайней мере . (Даже если 2.8 представляет округленное значение, SD все равно должно превышать 0,357.) SD 0,54 означает, что не более двух человек могли ответить с 5 (с 21 2 и 62 3), и не более 6 могли бы ответить с 1 (с 5 2 и 74 3). Это говорит о том, что вопрос может дать исключительно мало информации, потому что шкала не позволяет эффективно различать. 0.2×0.8знак равно0,4
whuber

@whuber отличные данные forsensics! Но я также мог предположить, что он либо усреднил по разным вопросам, либо сделал что-то не так в своих расчетах. Трудно представить, что люди действительно реагировали так единообразно, особенно когда говорили о своих предполагаемых способностях.
Эрик

Ответы:


17

Стандартные отклонения не являются «хорошими» или «плохими». Они являются индикаторами того, насколько распространены ваши данные. Иногда в шкалах оценок мы хотим широкого распространения, потому что это указывает на то, что наши вопросы / рейтинги охватывают диапазон группы, которую мы оцениваем. В других случаях мы хотим маленький SD, потому что мы хотим, чтобы все были "высокими".

Например, если вы тестировали математические навыки студентов на курсе по исчислению, вы могли бы получить очень маленький балл, задав им вопросы элементарной арифметики, такие как . Но предположим, что вы дали более серьезный тест на зачисление (то есть, сдавшие экзамен учащиеся перейдут в Исчисление I, а те, кто не прошел, сначала пройдут курсы более низкого уровня). Вы можете ожидать более низкое значение sd (и более высокое среднее значение) среди новичков в Массачусетском технологическом институте, чем в штате Южный Поданк, учитывая тот же тест.3+2

Так. Какова цель вашего теста? Кто в образце?


2
(+1) Просто добавить немного к замечанию «Стандартные отклонения не являются« хорошими »или« плохими »» - наличие предиктора с большим стандартным отклонением может быть «хорошим», потому что в регрессии оно обратно связано со стандартом погрешность оценки коэффициента регрессии. С другой стороны, если вас интересует точность измерения, тогда большое стандартное отклонение - это «плохо». Я предполагаю, что интерес к оригинальному постеру ближе к первому, но это не ясно.
Макрос

10

Короткий ответ, это хорошо и немного ниже, чем я мог ожидать от данных опроса. Но, вероятно, ваша бизнес-история больше в среднем или в процентах от двух лучших.

Для дискретных шкал из социологических исследований на практике стандартное отклонение является прямой функцией среднего значения. В частности, благодаря эмпирическому анализу многих таких исследований я обнаружил, что фактическое стандартное отклонение в опросах по пятибалльной шкале составляет 40-60% от максимально возможного отклонения (увы, здесь не документировано).

На простейшем уровне рассмотрим крайности, представьте, что среднее значение было 5,0. Стандартное отклонение должно равняться нулю, так как единственный способ получить среднее значение 5 - ответить каждому 5. Наоборот, если среднее значение равно 1,0, то стандартная ошибка также должна быть равна 0. Таким образом, стандартное отклонение точно определено с учетом среднего значения.

Теперь между ними больше серой зоны. Представьте, что люди могут ответить либо на 5.0, либо на 1.0, но между ними ничего нет. Тогда стандартное отклонение является точной функцией среднего:

stdev = sqrt ((среднее значение 5) * (среднее значение 1))

Максимальное стандартное отклонение для ответов по любой ограниченной шкале равно половине ширины шкалы. Здесь это sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Теперь, конечно, люди могут отвечать на ценности между ними. Исходя из метастазов данных обследований в нашей фирме, я обнаружил, что стандартное отклонение для числовых шкал на практике составляет 40-60% от максимального. конкретно

  • 40% для 100% точечных шкал,
  • 50% для 10-балльной шкалы и
  • 60% для 5-балльной шкалы и
  • 100% для бинарных весов

Поэтому для вашего набора данных я бы ожидал стандартное отклонение 60% х 2,0 = 1,2. Вы получили 0,54, что примерно вдвое меньше, чем я ожидал бы, если бы результаты были самоочевидными рейтингами. Являются ли оценки навыков результатами более сложных батарей тестов, которые являются средними и, следовательно, будут иметь более низкую дисперсию?

Реальная история, однако, вероятно, заключается в том, что способность настолько низка или так высока по сравнению с другими задачами. Сообщите средние значения или процентные доли в верхних 2 коробках между навыками и сфокусируйте свой анализ на этом.


-1

Если данные распределены нормально, вы можете увидеть, как располагается население.

  • 68% всех людей лежат в пределах 1 стандартного отклонения от среднего ( 2.26 - 3.34):

введите описание изображения здесь

  • 95% всех людей лежат в пределах 2 стандартных отклонений от среднего ( 1.72 - 3.88):

введите описание изображения здесь

Он говорит вам, насколько «разбросаны» ваши цифры.


1
За этот ответ не проголосовали, потому что он неправильный: он использует приблизительное эмпирическое правило (как если бы оно было точным) в случае, когда он неприменим. Ответ был бы верным, если бы его заменили выводы из неравенства Чебышева (в котором говорится, что по меньшей мере 75% наблюдений лежат в двух SD среднего значения, т. Е. По меньшей мере 75% ответов составляют 2 или 3), но это не даст много понимания.
whuber

Кроме того, это верно только для действительно нормально распределенных групп населения. Оттуда вы можете вычислить числа произвольно точно, оценивая интеграл по нормальному pdf с границами, заданными sd вокруг среднего значения. На самом деле не полезно здесь.
Дуба
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.