Ресурсы для обучения созданию визуализаций данных?


19

Мне интересно узнать, как создать тип визуализаций, которые вы видите на http://flowingdata.com, и информация прекрасна . РЕДАКТИРОВАТЬ: смысл, визуализации, которые интересны сами по себе - вроде как графика Нью-Йорк Таймс, в отличие от быстрого что-то для отчета.

Какие инструменты используются для их создания - это в основном Adobe Illustrator / Photoshop? Каковы хорошие ресурсы (книги, веб-сайты и т. Д.), Чтобы научиться использовать эти инструменты, в частности, для визуализации данных?

Я знаю, как должны выглядеть визуализации (и я знаком с принципами проектирования, например, из книг Туфте), но я не знаю, как их создавать.

Ответы:


20

Поступающие данные регулярно обсуждают инструменты, которые он использует. Смотрите, например:

Он также очень подробно показывает, как он создает графику, например:

На этом сайте есть и другие вопросы:

ИМО, попробуй:

  1. R и ggplot2: это хорошее вводное видео , но на сайте ggplot2 есть много ресурсов.
  2. Обработка: множество хороших учебников на главной странице .
  3. Protovis: также множество замечательных примеров на домашней странице .

Вы можете использовать Adobe впоследствии, чтобы очистить их.

Вы также можете посмотреть на webvisпакет R , хотя он и не такой полный, как ggplot2. С R вы можете запустить эту команду, чтобы увидеть пример Пшеницы на Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Наконец, мои любимые коммерческие приложения для интерактивной визуализации:


1
Круто, классные ссылки! Я уже использую R и ggplot2, но визуализации оттуда кажутся больше разновидностью «графика для отчета», чем разновидностью «конфетка для глаз / интересная сама по себе», которую я ищу. (ggplot2 очень красив, но на самом деле он не предназначен для неограниченного творчества.) Я ошибаюсь? Или вы иногда используете R / ggplot2 как вход для другого инструмента визуализации?
Рэгтин

5

Уже упомянутая обработка имеет хороший набор доступных книг. См .: 1 , 2 , 3 , 4 , 5 , 6 , 7

В Интернете вы найдете множество материалов, которые помогут вам начать с R. В качестве следующего шага ggplot2 имеет отличную веб- документацию . Я также нашел книгу Хэдли очень полезной.

Python может быть другим путем. Особенно с такими инструментами, как:

Все проекты хорошо документированы в Интернете. Вы могли бы также рассмотреть заглядывание в некоторые книги .

Наконец, книга « Графика больших наборов данных» также может помочь.


igraphработает и в R; для 3D openGL, ускоренного vis в R, используйте rgl& misc3dпакеты.

Также matplotlibучастки ужасны; они могут быть хорошими для многолетнего пользователя gnuplot.

2

Вы потратите много времени на ускорение с R.

RapidMiner является бесплатным и открытым исходным кодом и графическим, имеет много хороших визуализаций, и вы можете экспортировать их.

Если у вас есть свободные деньги или вы работаете в университете / университете, то JMP также очень хорош. Это может сделать несколько очень симпатичных графиков, очень очень легко. Можно экспортировать во флэш или PNG или PDF или что у вас есть.


5
1. ИМХО время, проведенное с R, хорошо инвестируется, если вы планируете делать что-то серьезное. 2. Также рассмотрите KNIME knime.org как альтернативу RapidMiner.
Радек

(+1) @radek. Я также являюсь поклонником быстрых идей, но, на мой взгляд, он недостаточно гибок для сложных визуализаций.
Штеффен

Если у вас есть опыт программирования, то вам не понадобится больше дня или около того, чтобы освоиться с R. Это довольно просто, если говорить о языках, и есть несколько отличных онлайн-уроков.
naught101

1

Другой хорошей альтернативой является библиотека протоисов http://vis.stanford.edu/protovis/

Это очень хорошо созданная библиотека JavaScript, которая может создавать прекрасные визуализации, если у вас есть время и возможность написать скромное количество необходимого кода JavaScript.

Я также очень рекомендую Tableau http://www.tableausoftware.com . Он отлично подходит для быстрого изучения наборов данных и создания множества различных визуализаций.

Оба продукта имеют корни в Stanford Visualization Group.


1

Здесь было дано много отличных ответов, и языки / библиотеки, которые вы выберете для изучения, будут зависеть от типа визуализации, который вы хотели бы сделать.

Однако, если вы используете Python регулярно, я настоятельно рекомендую Seaborn . Он очень сложный, когда дело доходит до визуализации статистических данных, но также выглядит довольно сложным с точки зрения представления.

Давайте возьмем пример. Предположим, вы пытаетесь построить график потребления электроэнергии для коммерческого здания по месяцам. Для этой цели в matplotlib может быть сгенерирован простой линейный график.

Однако, если мы хотим сделать визуализацию более сложной и информативной, мы могли бы создать тепловую карту с помощью seaborn:

Тепловая карта

Тепловая карта - это только один пример. Некоторые другие общие применения с Seaborn включают в себя:

  • Участки KDE
  • Участки роя
  • Участки для скрипки

Идея, стоящая за seaborn, состоит в том, чтобы представлять данные более интуитивно понятным способом, чем это было бы возможно при использовании более простых диаграмм, например, линий, столбцов, круговых диаграмм и т. Д.

Если это вас интересует - вы можете найти больше информации о seaborn здесь: https://seaborn.pydata.org/



0

R - это здорово, но не то, чтобы R трудно было понять, а в том, что в документации невозможно найти любое другое имя, такое как Rq. Поэтому, когда у вас возникла проблема, поиск решения - это кошмар, и документация тоже невелика. Matlab или Octave будут великолепны. И получить эти участки в R или Matlab было бы очень и очень утомительно.

ИМХО постобработка визуалов это лучший маршрут. Многие из них из текущих данных помещаются через Adobe Illustrator или Gimp. Это быстрее. Как только вы получите структуру графика, измените детали в редакторе. Использование R в качестве редактора не дает вам необходимой гибкости. Вы будете постоянно искать новые пакеты.


R; function??- R имеет встроенную помощь. Вы также можете обычно искать «кран», чтобы найти R, и я считаю, что большинство основных поисковых систем могут достаточно хорошо обрабатывать одну букву.
naught101



-3

Есть бесконечные ресурсы, но вы можете сузить их в зависимости от того, как вы хотите, чтобы ваши данные были преобразованы, сколько источников данных вы имеете дело, как они должны быть разделены, и т.д.

Вот руководство о том, как правильно выбрать ресурс, который может помочь вам в правильном направлении.


1
Поскольку вы связаны с этой группой, пожалуйста, заявите об интересе. Ответы только на ссылки не самые полезные. Совет на stats.stackexchange.com/help/promotion может применяться.
Ник Кокс
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.