Я делаю визуализацию данных. Каждый элемент представлен квадратом. Чтобы сделать базовые данные интуитивно понятными, длина стороны каждого квадрата или площадь каждого квадрата должны быть пропорциональны данным, которые они представляют?
Я делаю визуализацию данных. Каждый элемент представлен квадратом. Чтобы сделать базовые данные интуитивно понятными, длина стороны каждого квадрата или площадь каждого квадрата должны быть пропорциональны данным, которые они представляют?
Ответы:
Если вы, создатель, не уверены, как читатель узнает, что это такое?
Краткий ответ: значение должно быть связано 1: 1 с количеством цвета на странице . Так что в вашем примере это должна быть область. Но это еще не все: вам также нужно избегать вводящих в заблуждение подсказок, которые могут заставить читателя читать его неправильно, и вам нужно знать, почему вы используете область вместо длины (например, гистограммы), потому что у нее есть реальные плюсы и минусы.
Во-первых, никогда не изменяйте длину и ширину (т. Е. Площадь) изменения формы, когда на самом деле переменная связана только с длиной одной стороны. Если X - двойной Y, но Y имеет в четыре раза больше цвета на странице, вы вводите своих читателей в заблуждение. Такое искажение иногда называют « фактором лжи », и часто предполагается, что оно является преднамеренной попыткой ввести в заблуждение и преувеличить различия.
Если вы используете площадь в качестве меры, я настоятельно рекомендую:
Зная, почему вы используете область . Используя область вместо линейного размера, такого как длина, вы:
Подумайте об использовании кругов для области, а не квадратов по центру :
Например, выше, трудно не видеть квадрат с надписью «5» как три четверти высоты квадрата с надписью «10», так что это может ввести в заблуждение.
Круги не предлагают такого рода сравнения: это скорее интуитивный уровень, мгновенный «Этот шарик намного больше, чем следующий шарик».
Существует множество свидетельств от пользовательского тестирования до мелкомасштабных исследований (позже мы попытаемся найти некоторые примеры), что такого рода интуитивное сравнение на основе областей может быть более увлекательным, может снизить барьер для входа в менее заинтересованную аудиторию и может помогите сосредоточиться читателю на предмете, а не на холодных подробностях чисел. Но это происходит за счет того, что мы стоим на пути более численного анализа.
Не выбирайте между одномерным (длина или расстояние) и двухмерным (площадь) по эстетическим соображениям: выбирайте между ними в зависимости от вашей аудитории и сообщения.
Что больше подходит для общения: мгновенные сравнения на уровне кишечника на уровне «это намного больше» или более взвешенные численные сравнения на уровне «это примерно 80% от другого»?
Или есть практические причины, почему вам нужно использовать площадь?
Затем, когда вы выбрали по практическим соображениям, применять эстетику.
Я бы сказал, область. Оптически квадрат со стороной в два раза длиннее показывает площадь в 4 раза больше. Случайные наблюдатели будут относиться к области, даже не читая вашу легенду.
Хорошим примером является этот легендарный граф Рэндалла Манро из xkcd :
Мы не так хороши в оценке различий в области, как мы в длине. Мы используем длину в качестве прокси и поэтому склонны недооценивать различия в областях.
По этой причине круг, который на самом деле в 2 раза больше другого, кажется слишком маленьким, потому что наш мозг соотносит их радиусы, которые отличаются в 1,4 раза.
Существуют интересные попытки примирить этот феномен, например, « Пропорциональное сопоставление символов в R» , которое предлагает перцептивное масштабирование символов для более точного согласования с тем, как мы оцениваем длину и площади.
Вот рис. 2 из этой статьи
Лично я не имею никакого опыта в этом и избегаю использования областей, если требуются количественные суждения.
Интересная касательная - это связь между восприятием объема и длины. Разница в том, как мы их воспринимаем, еще более поразительна. Это можно проиллюстрировать на этом видео сравнений размеров звезд .
К тому времени, как вы доберетесь до самой большой звезды, которая примерно в 1700 раз больше диаметра Солнца, у вас останется впечатление, что она намного больше, чем 1700 раз.
Для более систематического взгляда на нашу ошибку в восприятии различий в областях и длинах см. Графическое восприятие краудсорсинга: использование Mechanical Turk для оценки дизайна визуализации Джеффри Хиером и Майклом Бостоком.
На мой взгляд, область (D), а не каждая сторона (E).
Если вы используете сторону длины 2, то площадь будет в 4 раза больше значения, и у вас будет очень перекрывающийся график. (Е)
Когда у вас есть нормальная гистограмма (A), данные являются линейными, и с гистограммой только для эстетики. (В)
В этих случаях область снова представляет данные, потому что столбцы одинаковы. Вы можете иметь 3D-бар, и все же объем бара является тот, который представляет данные (C)
Туфте занимался этим широко. Видеть:
Некоторые принципы графической целостности:
- Представление чисел, измеренное физически на поверхности самого графика, должно быть прямо пропорционально представленным числовым величинам.
- Четкая, подробная и тщательная маркировка должна использоваться, чтобы победить графическое искажение и двусмысленность. Выпишите объяснения данных на самом графике. Обозначьте важные события в данных.
- Показать изменения данных, а не изменения дизайна.
- При отображении денег во временных рядах дефлированные и стандартизированные единицы измерения денежной массы почти всегда лучше, чем номинальные единицы.
- Количество отображаемых информационных (переменных) измерений не должно превышать количество измерений в данных. Графика не должна указывать данные вне контекста.
В вашем случае вы должны спросить себя, лучше ли данные представлены 2D или 3D изображением или линией. Куб, квадрат и линия - это не одно и то же. Это одна из причин, по которой трехмерные гистограммы так часто вводят в заблуждение.