Форматирование графиков: когда уместно использовать заливку под линейным графиком?

13

Это вопрос визуализации данных - надеюсь, здесь можно задать этот вопрос.

Когда целесообразно использовать заливку под линейным графиком для временного ряда, как на графике ниже? (который показывает время пинга за день)

Линейный график с заливкой внизу

Я предполагаю, что более распространенным является использование простой линии без заливки внизу, но нормально ли использовать заливку для визуального разнообразия?

Мне было бы особенно интересно узнать о каких-либо исследованиях восприятия темы или о каких-либо руководствах по стилю.

data-visualization

— Ричард
источник

1

Если 0sнижняя граница естественная, и вы показываете ее, то почему бы и нет?

— ttnphns

1

Спросите другой способ - зачем использовать fill, если это не нужно? Представьте, что вы хотите добавить еще одну линию тренда, и все становится излишне сложным. Я также разделил бы единицу (и) оси Y и масштаб.

— мартин

11

В балансе эстетики и информативности графики есть немного искусства. Известные консультанты по визуализации / авторы, такие как Эдвард Туфте и Стивен Фью, выбирают минимальную эстетику, которая позволяет избежать отвлечения от информативных частей графика. Тем не менее, для некоторых зрителей оправдано небольшое количество процветания - см., Например, журналистское применение визуализации данных Альберто Каиром.

Угол исследования восприятия состоит в том, что каждый графический элемент передает сообщение, то, что мы не осознаем сознательно, потому что наш визуальный кортекс имеет дело с ним (« предварительная обработка »). Дополнительные элементы, даже избыточные, могут привести к дополнительной обработке. Соответствующий график зависит от сообщения, которое необходимо передать, и аудитории.

К вашему конкретному вопросу, связанная линия подчеркивает тренд (и отклонение от тренда). Заполненная область подчеркивает отклонение от базовой линии. Гистограмма или стрелочная диаграмма будут выделять отдельные события, отклоняющиеся от базовой линии.

Графический контекст также важен. Если у вас есть сетка плотно упакованных графиков, заливка поможет связать каждую линию с ее базовой линией.

Наконец, еще одно соображение по поводу добавления избыточных графических элементов / цветов - это затрудняет расширение графа более информативными элементами. Например, вы можете выделить специальные значения, наложить другие линии тренда или наложить полосы, например, в следующем макете.

введите описание изображения здесь

— Xan
источник

1

Я согласен с этим. Если график не должен быть красочным, потому что это обложка журнала / книги (а маркетологи хотят, чтобы он был цветным), для информирования следует использовать цвет. Если график выглядит «скучно», то виновником является тот факт, что основная информация не очень интересна или не очень интересна в формате линейного графика. В таких случаях, возможно, это было бы более полезно в виде круговой диаграммы, радиолокационного графика или чего-то еще.

— Роцинанте

1

Я предлагаю не использовать круговую диаграмму. Различия по длине дуги и площади клина сложнее, чем по высоте. Если вы мне не верите, сравните круговую диаграмму в соотношении 32:34:33 с той же гистограммой. Какой из них легче читать?

— Shadowtalker

2

Я говорил в общих чертах, а не специально для приведенного выше графика. Каждый тип диаграммы имеет свои достоинства. Определенный тип диаграммы подходит не во всех ситуациях.

— rocinante

4

Еще пара моментов для рассмотрения:

Как упомянуто в комментарии, недостаточное заполнение в значительной степени не подходит, если ось x не находится в точке с нулевым естественным y. Это может быть связано с тем, что ось y масштабируется так, чтобы начинаться с номера, отличного от нуля, или из-за того, что используемые единицы не имеют интерпретации с естественным нулем (например, у Кельвина есть естественный ноль, а у Цельсия - нет).

Во-вторых, случай, когда недостаточное заполнение является особенно допустимым, - это если сами данные можно считать недостаточно заполненными. Например, линейный график высоты горы имеет смысл не заполнять, цвет заливки представляет землю, а незаполненный представляет воздух.

Связанный пример может быть данными подсчета. Если бы мы сложили всех людей в каждой точке х, мы получили бы гистограмму. Если интерполяция между барами имеет смысл, мы получим линейный график с недостаточным заполнением.

Это изображение из «визуального отображения количественной информации» может объяснить это немного лучше. Это показывает, какие воинские части были в Европе во время второй войны (я думаю). Расстановка юнитов в каждый момент времени дает вам недостаточно заполненную гистограмму. Рисование линии поверх данных дает вам недостаточно заполненную линейную диаграмму.

— timcdlucas
источник

2

... Военные подразделения США были в Европе во время Первой мировой войны (даты 1917 и 1918 годов рассказывают историю).

— Ник Кокс

@nickCox Конечно. Понятия не имею, почему я этого не видел.

— Timcdlucas

4

Предыдущие два ответа охватывают основные важные моменты, но есть несколько вещей, которые все же следует упомянуть.

Во-первых, я должен сказать, что я не согласен с экстремальным минималистским подходом к графике - все лишние чернила должны исчезнуть. Отвлекающие, бессмысленные вариации должны идти. Но сплошная область по сравнению с одной линией может лучше заметить и больше общаться с первого взгляда. И, как вы говорите, это может добавить «визуальное разнообразие».

Однако, как указывает @xan, этот быстрый взгляд также интерпретирует область иначе, чем линия, в некоторой степени частично подсознательно.

Граф области подразумевает общее количество, которое накапливается по мере продвижения вдоль оси X. Если вы сравните два графика, и на одном из них будет заполнена большая область, ваш взгляд скажет вам, что он имеет большую сумму независимо от начального и конечного значений.

Напротив, линейный график показывает изменение значения. Основное внимание уделяется изменению положения от одной точки к другой, а не общей сумме.

Итак, когда вы должны использовать граф области?

когда значения представляют чистую величину с определенной нулевой точкой, показанной на графике;
когда значение представляет собой сумму, добавленную (или удаленную) в каждой точке, такую как нормальное ежедневное количество осадков или ежемесячная прибыль / убыток;
когда значение представляет распределение населения, что означает, что общая площадь под кривой представляет общий размер выборки, например, кривая колокола для числа учащихся с разными оценками (в основном сглаженная гистограмма).

Идея состоит в том, что при чтении графика, если вы берете две точки на оси x, область, показанная между ними, должна представлять фактическое количество чего-то, накапливающегося в этом диапазоне. По этой причине, если ваши значения включают отрицательные суммы, я бы рекомендовал использовать противоположные цвета для отрицательных и положительных областей, чтобы подчеркнуть, что они сводятся к итоговой сумме.

Когда вы должны не использовать область графика?

когда нулевая точка является произвольной (как при не абсолютной температуре, как сказал @timcdlucas), недействительной (как при измерениях, которые представляют собой отношение двух значений, например, обменный курс), или не показана на графике по пространственным причинам;
когда значения, показанные высотой линии, уже представляют кумулятивную меру, такую как общее количество осадков на дату (за месяц / год) или долг / сбережения;
когда значения представляют положение / значение одного изменяющегося объекта, а не накопление;
когда вы хотите сравнить несколько линий на одном графике (если вы не видите всю область, вы теряете смысл - вместо этого сравнивайте графики областей).

Учитывая эти рекомендации, ваш граф ping может быть интерпретирован двумя способами.

С одной стороны, если вы думаете о скорости пинга как о единственной переменной, которая меняется в течение дня, тогда наиболее подходящим будет простой линейный график.

С другой стороны, если вы сравнивали суточные значения скорости пинга двух разных сетей (или одну и ту же сеть в разные дни / периоды времени), то, возможно, вы захотите выделить общее количество времени, необходимое для сетевых задач. Например, если ваш график имеет несколько пиков, а не один, линейный график будет подчеркивать изменчивость скорости, в то время как график области будет выделять общую задержку.

Сравните:
Линейный график Тот же график с заполненной областью
совокупный итог немного больше в первой половине графика (слева от красной линии), чем во второй, даже если пики достигают более высоких максимальных значений справа. Заполнение подчеркивает этот сплошной блок слева, так что он лучше балансирует против пиков.

(Простите за плохое качество изображения - не мог понять, как заставить R сделать граф области! Пришлось экспортировать и редактировать отдельно.)

— AmeliaBR
источник