Визуализация данных ответа Лайкерта


25

Каковы хорошие способы визуализации множества ответов Лайкерта?

Например, набор вопросов, спрашивающих о важности X для чьих-либо решений об A, B, C, D, E, F & G? Есть ли что-то лучше, чем гистограммы?

  • Что делать с ответами N / A? Как они могут быть представлены?
  • Должны ли гистограммы отображать проценты или количество ответов? (т.е. должны ли бары иметь одинаковую длину?)
  • Если проценты, должен ли знаменатель включать недействительные и / или нет ответов?

У меня есть свои взгляды, но я ищу идеи других людей.

Ответы:


30

Мне нравится представление по центру счета. Эта конкретная версия удаляет нейтральные ответы (фактически рассматривая нейтральные и н / д как одинаковые), чтобы показать только количество мнений, согласных / не согласных. Точка 0 - это место, где встречаются красный и синий. Ось отсчета обрезана.

альтернативный текст

Для сравнения, здесь представлены те же пять ответов, что и в процентах с накоплением, которые показывают как нейтральный (серый), так и отсутствие ответа (белый).

альтернативный текст

Обновление: Бумага, предлагающая подобный метод: Построение Лайкерта и других рейтинговых шкал (PDF)


2
(+1) Интересно! Какое программное обеспечение вы используете? Просто замечание: нет никаких указаний об абсолютных значениях для% или счетчиков, так что, похоже, это допускает только относительную интерпретацию.
хл

Извините, я не прочитал ваше последнее предложение (ось X невидима). Я попробую еще одно замечание: есть ли шанс, чтобы счетчики АН были видны в центрированном виде (т.е. отличать их от нейтральных)?
хл

@chl Спасибо. Я использую JMP, за что мне платят за работу. Первая представляет собой гистограмму с накоплением положительных и отрицательных значений, что должно быть возможно во многих инструментах. Подсчет NA может быть выполнен по-разному (с одного конца, с разбивкой по обоим концам, по центру, в отдельном столбце), и ни один из них не кажется явно лучшим для большинства ситуаций.
Xan

2
Просто хотел добавить для Rпользователей, что эти виды графиков реализованы в пакете HH. Чтобы произвести впечатление, вы можете попробовать likert(t(apply(data, 2, table))).
hplieninger

1
Я думаю, что это ссылка «Б. Роббинс, Наоми; М. Хейбергер, Ричард (2011).« Построение графиков Лайкерта и других рейтинговых шкал ». JSM 2011: 1058–1066».
Кит Джонсон

23

Сложенные столбцы, как правило, хорошо понимаются статистиками, если их осторожно представить. Полезно масштабировать их по общему метрику (например, 0-100%), с постепенным цветом для каждой категории, если они являются порядковыми (например, Лайкерт). Я предпочитаю точечную диаграмму (точечный график Кливленда), когда не слишком много предметов и не более 3-5 категорий ответов. Но это действительно вопрос визуальной ясности. Я обычно предоставляю%, поскольку это стандартизированная мера, и сообщаю только% и подсчеты с диаграммой без суммирования. Вот пример того, что я имею в виду:

data(Environment, package="ltm")
Environment[sample(1:nrow(Environment), 10),1] <- NA
na.count <- apply(Environment, 2, function(x) sum(is.na(x)))
tab <- apply(Environment, 2, table)/
       apply(apply(Environment, 2, table), 2, sum)*100
dotchart(tab, xlim=c(0,100), xlab="Frequency (%)", 
         sub=paste("N", nrow(Environment), sep="="))
text(100, c(2,7,12,17,22,27), rev(na.count), cex=.8)
mtext("# NA", side=3, line=0, at=100, cex=.8)

альтернативный текст

Лучшего рендеринга можно достичь с помощью latticeили ggplot2. Все элементы имеют одинаковые категории ответов в этом конкретном примере, но в более общем случае мы можем ожидать разные, так что показ всех из них не будет казаться избыточным, как в данном случае. Однако можно было бы придать одинаковый цвет каждой категории ответов, чтобы облегчить чтение.

Но я бы сказал, что составные столбцы лучше, когда все элементы имеют одинаковую категорию ответов, так как они помогают оценить частоту одного способа ответа между элементами:

альтернативный текст

Я также могу подумать о какой-то тепловой карте, которая полезна, если есть много предметов с похожей категорией ответов. альтернативный текст

Следует сообщать об отсутствующих ответах (особенно если они незначительны или локализованы на конкретный элемент / вопрос), в идеале для каждого элемента. Как правило,% ответов для каждой категории рассчитываются без NA. Это то, что обычно делается в опросе или психометрии (мы говорим о «выраженных или наблюдаемых ответах»).

PS Я могу думать о более необычных вещей , как на картинке показано ниже (первая была сделана вручную, второй из ggplot2, ggfluctuation(as.table(tab))), но я не думаю , что это передать в качестве точной информации dotplot или столбиковых , поскольку поверхностные вариации трудно оценить. альтернативный текст

альтернативный текст


2
Кстати, вопрос о графике ответов по шкале Лайкерта только что натолкнулся на блог Эндрю Гельмана вчера :) j.mp/aBm8mZ
chl

14

Я думаю, что ответ ЧЛ это здорово.

Одна вещь, которую я мог бы добавить, это случай, когда вы хотите сравнить соотношение между предметами. Для этого вы можете использовать что-то вроде корреляционной матрицы рассеяния для упорядоченных категориальных данных.

альтернативный текст

(Этот код все еще нуждается в доработке - но он дает общую идею ...)


3
(+1) Это напоминает мне о pairs.panelsфункции в psychпакете W Revelle.
ЧЛ

Интересный. Я сталкивался с этим кодом, но никогда не знал, что он также существует в пакете психики. Я уверен, что это каким-то образом вдохновило меня, когда я написал этот пост (я должен добавить это к титрам на посту ...)
Тал Галили
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.