Какую хорошую базовую статистику использовать для порядковых данных?


67

У меня есть некоторые порядковые данные, полученные из вопросов опроса. В моем случае это ответы в стиле Лайкерта (категорически не согласен-не согласен-нейтрален-согласен-полностью согласен). По моим данным они кодируются как 1-5.

Я не думаю, что средства здесь много значат, так что какая основная сводная статистика считается полезной?


2
Распространенный выбор включает - медианы, способы, пропорции или совокупные пропорции в каждой группе
Glen_b

Ответы:


29

Таблица частот - хорошее место для начала. Вы можете сделать подсчет и относительную частоту для каждого уровня. Также могут быть полезны общее количество и количество пропущенных значений.

Вы также можете использовать таблицу сопряженности для сравнения двух переменных одновременно. Может отображаться с использованием мозаичного графика тоже.


32

Я собираюсь утверждать с прикладной точки зрения, что среднее часто является лучшим выбором для суммирования центральной тенденции элемента Лайкерта. В частности, я имею в виду такие контексты, как опросы удовлетворенности студентов, шкалы исследования рынка, опросы общественного мнения, тесты личности и многие социологические опросы.

В таких условиях потребители исследований часто хотят получить ответы на такие вопросы, как:

  • Какие утверждения имеют более или менее согласие относительно других?
  • Какие группы согласились более или менее с данным утверждением?
  • Со временем соглашение пошло вверх или вниз?

Для этих целей среднее имеет несколько преимуществ:

1. Среднее значение легко рассчитать:

  • Легко увидеть связь между необработанными данными и средним значением.
  • Это прагматически легко вычислить. Таким образом, среднее значение может быть легко встроено в системы отчетности.
  • Это также облегчает сопоставимость между контекстами и настройками.

2. Среднее значение относительно хорошо понято и интуитивно понятно:

  • Среднее значение часто используется для сообщения о центральной тенденции предметов Лайкерта. Таким образом, потребители исследования с большей вероятностью поймут среднее (и, следовательно, доверят ему и будут действовать в соответствии с ним).
  • Некоторые исследователи предпочитают, пожалуй, еще более интуитивный вариант сообщения о проценте выборки, отвечающей на 4 или 5. Т.е. он имеет относительно интуитивную интерпретацию «процентного согласия». По сути, это просто альтернативная форма среднего с 0, 0, 0, 1, 1кодированием.
  • Кроме того, со временем потребители исследований выстраивают ориентиры. Например, когда вы сравниваете свои результаты преподавания из года в год или по предметам, вы формируете нюанс того, что означает среднее значение 3,7, 3,9 или 4,1.

3. Среднее значение - это одно число:

  • Одно число особенно ценно, когда вы хотите заявить, что «студенты были более удовлетворены предметом X, чем предметом Y».
  • Я также нахожу эмпирически, что одно число на самом деле является основной информацией, представляющей интерес для предмета Лайкерта. Стандартное отклонение, как правило, связано со степенью, в которой среднее значение близко к центральной оценке (например, 3,0). Конечно, эмпирически, это не может применяться в вашем контексте. Например, я где-то читал, что когда в рейтингах You Tube использовалась звездная система, было большое количество самых низких или самых высоких оценок. По этой причине важно проверить категории частот.

4. Это не имеет большого значения

  • Хотя я официально не проверял это, я бы выдвинул гипотезу о том, что для сравнения рейтингов центральной тенденции по предметам, группам участников или по времени любой разумный выбор масштабирования для получения среднего значения приведет к аналогичным выводам.

4
Хороший пост! Есть ли у вас какие-либо мысли о том, как разные культуры / страны могут использовать шкалы Ликерта, которые могли бы кардинально повлиять на результаты такого рода?
Погоня

@chase Есть исследование по этому вопросу, но я давно на это не смотрел. Вот пример поиска в Google scholar scholar.google.com.au/…
Джером Энглим

Я согласен с обоснованием г-на Джерома Англима об использовании среднего значения (то есть взвешенного среднего значения, чтобы быть точным) в качестве наиболее надежной и объективной более описательной интерпретации упорядоченных категориальных переменных, таких как использование шкалы Лайкерта, где каждая из точек данных вносит вклад в итоговое среднее


28

Что касается базовых резюме, я согласен с тем, что таблицы частоты отчетов и некоторые признаки центральной тенденции - это хорошо. Например, в недавней статье, опубликованной в PARE, обсуждались t-тест MWW, пятиточечные элементы Лайкерта: t-тест против Манна-Уитни-Уилкоксона .

Для более детального лечения я бы порекомендовал прочитать обзор Агрести по упорядоченным категориальным переменным:

Лю, Y и Агрести, А (2005). Анализ упорядоченных категориальных данных: обзор и обзор последних событий . Sociedad de Estadística e Investigación Operativa Test , 14 (1), 1-73.

Он в значительной степени выходит за рамки обычной статистики, такой как модель на основе порогов (например, пропорциональное отношение шансов), и его стоит прочитать вместо книги Агрести CDA .

Ниже я показываю картину трех разных способов обработки предмета Лайкерта; сверху вниз, «частотное» (номинальное) представление, «числовое» представление и «вероятностное» представление (модель частичного кредитования ):

альтернативный текст

Данные поступают из Scienceданных в ltmпакете, где пункт касается технологии («Новая технология не зависит от фундаментальных научных исследований», с ответом «категорически не согласен» на «полностью согласен», по четырехбалльной шкале)


14

Обычной практикой является использование непараметрической статистики рангов суммы и среднего ранга для описания порядковых данных.

Вот как они работают:

Сумма рангов

  • присвоить звание каждому члену каждой группы;

  • например, предположим, что вы смотрите на цели для каждого игрока в двух противостоящих футбольных командах, а затем оцените каждого участника в обеих командах от первого до последнего;

  • рассчитать сумму рангов путем сложения рангов по группе ;

  • величина суммы ранга говорит вам, насколько близко друг к другу ранги для каждой группы

Средний рейтинг

M / R является более сложной статистикой, чем R / S, потому что она компенсирует неравные размеры в сравниваемых группах. Следовательно, в дополнение к описанным выше шагам вы делите каждую сумму на количество участников в группе.

Получив эти две статистические данные, вы можете, например, выполнить z-тест ранговой суммы, чтобы увидеть, является ли разница между двумя группами статистически значимой (я полагаю, это известно как критерий суммы рангов Уилкоксона , который является взаимозаменяемым, то есть функционально эквивалентно U-критерию Манна-Уитни).

R Функции для этой статистики (те, о которых я в любом случае знаю):

wilcox.test в стандартной установке R

meanranks в Шатуны Пакет


3

На основании реферата Эта статья может быть полезна для сравнения нескольких переменных, которые имеют шкалу Лайкерта. Он сравнивает два типа непараметрических множественных сравнительных тестов: один на основе рангов и один на основе теста Чакко. Это включает в себя симуляции.


В настоящее время это выглядит как комментарий @PeterFlom. Хотя цифровая библиотека ACM, вероятно, менее восприимчива к гниению ссылок, не могли бы вы сказать что-нибудь о статье, возможно, о ее полезной информации?
gung - Восстановить Монику

2
Привет @ Gung Я не был уверен, где разместить комментарий в этой длинной теме. Я добавил цитату здесь, так как вопрос, опубликованный сегодня, был закрыт, и эта статья кажется полезной (и охватывает вопросы, которые я не видел в других местах)
Питер Флом - Восстановить Монику

2

Я обычно люблю использовать мозаичный сюжет. Вы можете создать их, включив другие ковариаты интереса (такие как: пол, стратифицированные факторы и т. Д.)


2

Я согласен с оценкой Джерома Англима. Помните, что ответы Лайкерта являются оценками - вы не используете совершенно надежную линейку для измерения физического объекта со стабильными размерами. Среднее значение является мощной мерой при использовании разумных размеров выборки.

В сфере бизнеса и исследований и разработок среднее значение является наиболее распространенной статистикой, используемой в шкалах Лайкерта. При использовании шкал Лайкерта я обычно выбирал меру, которая идеально подходит для вопроса исследования. Например, если вы говорите о «предпочтениях» или «отношениях», вы можете использовать несколько индикаторов на основе Лайкерта, каждый из которых обеспечивает несколько иную информацию.

Чтобы оценить вопрос «как люди в сегменте реагировать на предложение услуг », я могу посмотреть на (1) среднее арифметическое, (2) точную медиану, (3) процент наиболее благоприятных ответов (верхняя часть), (4)% верхние два блока, (5) отношение двух верхних блоков к нижним двум полям, (6) процентное соотношение в полях среднего диапазона ... и т. д. Каждая мера рассказывает отдельную часть истории. В очень важном проекте я использую несколько индикаторов на основе Лайкерта. Я также буду использовать несколько индикаторов с небольшими выборками и когда конкретная кросс-таблица имеет «интересную» структуру или выглядит насыщенной информацией. Аааа ... искусство статистики.хiX


1

«Коробочные баллы» часто используются для обобщения порядковых данных, особенно когда речь идет о значимых словесных привязках. Другими словами, вы можете сообщить о «верхнем 2 ящике», проценте, который выбрал «согласен» или «полностью согласен».

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.