Я согласен, что «лучший» сюжет не существует независимо от набора данных, читателей и цели. Для двух измеренных переменных, точечные диаграммы, возможно, являются схемой, которая оставляет все остальные на своем пути, за исключением особых целей, но такого категоричного лидера для категориальных данных не видно.
Моя цель здесь - просто упомянуть простой метод, часто заново открываемый или переизобретаемый, но, тем не менее, также часто упускаемый из виду даже в монографиях или учебниках, посвященных статистической графике.
Сначала пример, охватывающий те же данные, что и xan:
Если имя требуется, как это часто бывает, это двухсторонняя диаграмма (в данном случае). Я не буду каталогизировать другие термины здесь, за исключением того, что множественный BarChart является одной из распространенных альтернатив с похожим вкусом. (Мое маленькое возражение против «множественного столбца» состоит в том, что «множественный» не исключает очень распространенных гистограмм с накоплением или рядом друг с другом, тогда как «twoway» для меня более четко подразумевает расположение строк и столбцов, хотя в свою очередь это может привести примеры, чтобы прояснить это.)
Плюсы и минусы для этого вида сюжета также просты, но я изложу некоторые из них. Поскольку мне нравится этот дизайн (который восходит по крайней мере к 1930-м годам), другие могут захотеть добавить более резкую критику.
+1. Идея легко понятна даже нетехническим группам. Высота полос или длины полос в этом примере кодируют частоты. В других примерах они могут кодировать проценты, рассчитанные любым способом, остатки и т. Д.
+2. Структура строк и столбцов соответствует структуре таблицы . Вы можете добавить числовые значения тоже. Очень малые количества и даже неявные нули отчетливо видны, что не всегда имеет место с другими проектами (например, гистограммы с накоплением, мозаичные графики). Маркировка строк и столбцов обычно более эффективна, чем добавление ключа или легенды, с ментальным «туда-сюда», который требуется. Таким образом, этот дизайн объединяет идеи графиков и таблиц, что, похоже, беспокоит некоторых читателей; и наоборот, я бы сказал, что сильные различия между рисунками и таблицами - это просто историческое похмелье, устарело теперь, когда исследователи могут готовить свои собственные документы и не должны полагаться на дизайнеров, композиторов и принтеров.
+3. Расширение до трехстороннего и более высокого дизайна в принципе легко . Поместите две или более переменных в качестве составных переменных на одну или обе оси или укажите массив таких графиков. Естественно, чем сложнее дизайн, тем сложнее интерпретация.
+4. Конструкция явно допускает порядковые переменные на любой оси. Порядок может быть выражен (например) путем соответствующего затенения, а также порядка категорий на этой оси. Порядок категорий по осям может быть определен по их значению или лучше определен по частотам; алфавитный порядок в соответствии с текстовыми метками может быть по умолчанию, но никогда не должен рассматриваться как единственный выбор.
-1. Будучи общим в дизайне, сюжет может быть менее эффективным, показывая некоторые виды отношений . В частности, мозаичный сюжет может очень четко обозначить отклонения от независимости. И наоборот, когда отношения между категориальными переменными являются сложными или неясными, то, как правило, ни один график не может показать больше, чем этот слабый факт.
-2. В некоторых отношениях дизайн неэффективен в использовании пространства , оставляя место для каждой перекрестной комбинации независимо от того, часто ли это происходит или происходит. Это порок того же принципа, который считается добродетелью. Конкретный дизайн над категориями пространств одинаково независимо от их частоты; жертвуя этим, часто жертвую читаемыми маргинальными надписями, которые я очень ценю. В этом примере все текстовые метки бывают очень короткими, но это далеко не типично.
Примечание: данные xan кажутся просто выдуманными, поэтому я не буду пытаться интерпретировать их больше, чем в других ответах. Но немного домашней мудрости заслуживает последнего слова: лучший дизайн для вас - это тот, который лучше всего передает вам и вашим читателям структуру некоторых реальных данных, которые вам небезразличны.
Другие примеры включают
Как вы можете визуализировать отношения между 3 категориальными переменными?
График отношений между двумя порядковыми переменными