Кто-нибудь знает хорошее программное обеспечение с открытым исходным кодом для визуализации данных из базы данных?


50

Недавно я наткнулся на Tableau и попытался визуализировать данные из базы данных и CSV-файла. Пользовательский интерфейс позволяет пользователю визуализировать временные и пространственные данные и мгновенно создавать графики. Такой инструмент действительно полезен, так как позволяет графически наблюдать данные без написания кода.

Поскольку существует много источников данных, из которых мне приходится извлекать и визуализировать данные, было бы очень полезно иметь инструмент, который позволял бы генерировать диаграммы, просто перетаскивая столбцы по осям и дополнительно изменяя визуализацию, также перетаскивая имена столбцов.

Кто-нибудь знает какое-либо бесплатное или открытое программное обеспечение такого рода?


1
Под базой данных вы подразумеваете SQL, Postgres, Mongo-подобные структуры? (У Induction for Mac есть такие функции.) Или вы после какой-либо программы, которая принимает файлы CSV и позволяет перетаскивать столбцы на графические шаблоны, или как GGobi ?
хл

Я создал инструмент для построения плоттеров github.com/burlachenkok/plotter_plusplus
bruziuz

Ответы:


38

Я никогда не пробовал, но есть пакет визуализации с открытым исходным кодом для настольных компьютеров и браузеров, который называется WEAVE (сокращение от Web-среды анализа и визуализации). Как и Tableau, он предназначен для изучения данных с помощью интерактивного интерфейса, основанного на щелчках. В отличие от Tableau, это открытый исходный код: вы можете скачать исходный код и установить собственную версию на свой компьютер, который может быть настолько приватным или общедоступным, насколько вы этого хотите. Ничего не ожидал почти как пятно и удобным, Tableau, но это выглядит как интересный, мощный проект для кого - то готов поставить время , чтобы научиться использовать его.

введите описание изображения здесь введите описание изображения здесь введите описание изображения здесь


Или вы можете посмотреть на свои собственные . Есть несколько действительно хороших инструментов javacript с открытым исходным кодом для поддержки визуализации данных программирования в браузере. Если вы не против написания кода Javascript и серверного уровня для обработки данных, попробуйте:

  • Набор данных Miso для получения, обработки, управления и очистки данных на стороне клиента в Javascript (включает анализатор CSV)
  • D3 для интерактивной визуализации в SVG (работает в любом браузере, кроме IE8 и более ранних и старых (v1, v2) телефонов Android).
  • gRaphael для интерактивных кросс-браузерных стандартных диаграмм
  • Рафаэль, если вам нужен вывод SVG для работы в Internet Explorer 6, 7 и 8.

Если вам интересен вариант веб-программирования, вот несколько более подробное описание, которое я написал для Raphael и D3 для stackoverflow .


Также есть несколько бесплатных (не с открытым исходным кодом) онлайн- пакетов данных, о которых стоит упомянуть (вероятно, не подходит для прямого подключения к БД, но стоит посмотреть):

  • Raw by Density Design - введение в блог - (нажмите «Выбрать образец данных», чтобы попробовать его) - в основном на основе копирования и вставки, не уверен, что у него есть API, который может подключаться к базе данных, но хорошо для быстрой проверки.
  • Tableau Public - бесплатная онлайн-версия Tableau. Суть в том, что данные, которые вы вводите, и любые создаваемые вами визуализации должны быть общедоступными.

И что-то совершенно другое: если у вас есть качественный сервер, и вы хотите создавать удивительные карты на скользящей основе в стиле google-карт с использованием технологий с открытым исходным кодом (вероятно, не то, что вы ищете - но это возможно! ), ознакомьтесь с MapBox TileMill . Посмотрите галерею примеров на их домашней странице - некоторые из них действительно потрясающие. См. Также связанный проект Modest Maps , библиотеку Javascript с открытым исходным кодом для взаимодействия с картами, разработанную Stamen Design (действительно высоко оцененным агентством, специализирующимся на интерактивных картах). Это считается улучшением более устоявшихся OpenLayers. Все с открытым исходным кодом.

введите описание изображения здесь


WEAVE - лучший инструмент с открытым исходным кодом на основе графического интерфейса для личного визуального анализа .

Другие перечисленные инструменты являются лучшими из всех инструментов для онлайн-публикации визуализаций (например, D3 используется и разрабатывается отмеченной наградами командой разработчиков NY Times ) и чаще используются для визуализации в контексте публичного представления. связи, чем исследовательский анализ, но они также могут быть использованы для анализа.


7

Интерфейсы «укажи и щелкни» кажутся более простыми, но в долгосрочной перспективе вы выиграете, научившись «писать код».

Одним из преимуществ систем на основе сценариев по сравнению с интерфейсами «точка-щелчок-перетаскивание» является контрольный журнал / история (некоторые графические интерфейсы имеют историю, но с ними обычно не так легко работать, как с сохраненным сценарием). Если вы напишете некоторый код для создания и сохранения своего графика, то его всегда легко перезапустить или сделать небольшие изменения, а затем повторно запустить, не всегда легко запомнить набор щелчков и перетаскиваний, использованных для создания предыдущего графика.

Сценарии также будут намного быстрее для большого количества сюжетов. Написание кода для первого графика займет немного больше времени, но добавление только пары строк и некоторые небольшие модификации могут позволить вам перебрать 100 или более переменных с небольшими дополнительными усилиями, когда вам нужно выполнить тот же набор кликов. и тянет снова и снова для каждого сюжета.

Многие инструменты построения графиков на основе сценариев имеют графический интерфейс, который позволяет вам использовать указатель и щелчок, чтобы начать работу, но помогает вам изучить код и перейти к более мощным методам.

Я рекомендую R, который является бесплатным и открытым исходным кодом и имеет некоторые доступные графические интерфейсы (Rcmdr, jgr, rstudio и т. Д.) В качестве хорошего варианта.


4
В то время как инструменты на основе сценариев помогут вам многократно создавать одну и ту же диаграмму с различными источниками данных, интерактивные инструменты намного удобнее для исследования и обнаружения в новом наборе данных. Когда задаете вопрос, вы просто нажимаете одну или две кнопки, чтобы изменить ось, цветовые шкалы, кластеры и т. Д., Вместо того, чтобы писать код для этого. Это намного дешевле, и отмена стека или просмотр истории исследований позволит вам вернуться, если вы допустите какие-либо ошибки.
edallme

1
@edallme, я не согласен. То, что вы говорите, может быть правдой для людей, которые знакомы с основами интерфейса GUI и не знают инструментов сценариев, но я думаю, что это аргумент для изучения инструментов сценариев. В моем случае я ожидаю, что нажатие стрелки вверх, стрелки влево и ввода чего-то вроде «col.axis = 'blue'" займет меньше времени, чем перемещение моей руки к мыши, нажатие на график и поиск по опциям , Кто-то, начинающий с графического интерфейса, может дать представление о том, что можно изменить, но я предпочитаю тех, которые показывают код, чтобы они изучали лучший подход.
Грег Сноу

1
Мне нравится подход Stata с графическим интерфейсом для выбора параметров, а затем выкладывания кода, который можно использовать повторно, когда вы нажмете «ОК». Полезно иметь скрипты, когда вам нужно автоматизировать вещи. Но поисковый поиск - это гораздо больше, чем изменение параметров графика один или два раза. В хороших интерактивных инструментах пользователи могут изменять столбцы, используемые для диаграммы, одним нажатием кнопки или клавиши со стрелкой, фильтровать подмножества данных с помощью ползунка или перетаскивания, а также могут перемещаться между диаграммами, показывающими подключенные точки данных. , Более того, каждое изменение отображается менее чем за 100 мс и не наказывает пользователей.
edallme

1
Стоит добавить, что в настоящее время существуют пакеты R, которые значительно упрощают веб-приложения. Смотрите блестящий или opencpu
jangorecki

@GregSnow: это действительно зависит от пакета визуализации. Я могу получить действительно хороший, подробный сюжет с аспектами и всем этим джазом, работающим в ggplot намного, намного быстрее, чем я мог с любым графическим интерфейсом. Чего нельзя сказать о matplotlib, базовых R-участках и многих других пакетах.
naught101

3

RapidMiner имеет хорошую визуализацию:

http://rapid-i.com/component/option,com_myblog/show,New-Plotters-for-RapidMiner.html/Itemid,172/lang,en/

И, конечно же, есть R + ggplot2, использующий веб-интерфейс или графический интерфейс:

http://labs.dataspora.com/ggplot2/

http://www.deducer.org/pmwiki/index.php?n=Main.PlotBuilder


R + Mondrian или ggobi также хороши
wdkrnls

1

Вы можете использовать бесплатный облачный сервис по адресу https://my.infocaptor.com/free_data_visualization.php

Онлайн-версия позволяет загружать любые данные CSV / Excel и быстро визуализировать их. Вам не нужен логин для этого. Если вы хотите работать с базами данных, вам нужно будет войти в систему или вы можете скачать программное обеспечение.

PS: я являюсь частью компании, которая делает этот продукт


Добро пожаловать на наш сайт. Это немного редко, вы можете добавить больше? Кроме того, я полагаю, что это ваш собственный сервис, поэтому вы должны упомянуть об этом (но я думаю, что можно размещать это здесь, если это бесплатно, и вы открыты для этого).
gung - Восстановить Монику


1

Существует новый инструмент под названием Helical Insight, который представляет собой инструмент BI с открытым исходным кодом, с помощью которого вы можете создавать диаграммы, отчеты, информационные панели и различные визуализации данных. С его помощью вы можете создавать отчеты двумя способами: Самообслуживание BI и Instant BI. В самообслуживании BI вы перетаскиваете n столбцов, которые хотите, добавляете фильтры, чтобы в конечном итоге создавать идеи. «Мгновенная бизнес-аналитика» - это функция, в которой вы можете ввести любой бизнес-вопрос и получить мгновенную информацию. Что касается визуализации данных, вы можете иметь встроенные простые диаграммы, научные диаграммы, а также очень удобно встраивать в них свои собственные диаграммы. Посетите www.helicalinsight.com


1

На самом деле есть правильный ответ на этот вопрос, Оранж . Когда вопрос был опубликован, он уже был выпущен. В системах на основе Linux его можно просто установить с помощью индекса пакетов Python с помощью, pip install orange3а также он находится в хранилище пользователя Arch для Arch Linux, Manjaro, ALARM и других дистрибутивов на основе Arch.

Кроме того, на StackExchange существует практически тот же вопрос, в котором упоминается еще несколько коммерческих / веб-альтернатив (которые закрыты и приводятся ссылки здесь). Еще несколько можно найти на Quora , но Orange является единственным открытым исходным кодом, скомпилированным и имеющим графический интерфейс, который мне известен. На мой взгляд, он имеет довольно совершенный, эстетичный и минималистичный интерфейс.



0

Существует также молодая программа для (автоматического) чтения, фильтрации, обработки, интерполяции и построения n-мерных значений из разных источников (например, libreOffice- или csv-файлов) и переменного размера: diaGrabber .

Вы должны использовать несколько простых команд python для создания кейса. После этого вы можете управлять графическим выводом в интерактивном графическом интерфейсе .

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.