Кажется, самая распространенная проблема с этими типами «потоковых карт» состоит в том, что, когда включено много линий, они сталкиваются до такой степени, что затрудняет обнаружение любого неочевидного паттерна (когда рассматриваются взаимные потоки, это случается с в еще большей степени). Также длинные линии имеют тенденцию доминировать над графиком, хотя вполне возможно, что распределение потоков происходит преимущественно по коротким промежуткам (например, множество различных распределений между местами, как правило, похоже на полеты Леви ). Я полагаю, что это не обязательно плохо (длинные строки могут быть более интересными, чем короткие линии для многих явлений), но я не думаю, что мы хотим, так сказать, потерять лес за деревьями.
Хотя я не сомневаюсь, что пропустил некоторые потенциальные «решения», которые были предложены, я постараюсь обобщить некоторые способы, которыми люди пытались решить проблему в работе, с которой я столкнулся.
Искажая Линии
Если вы просматриваете некоторые другие темы, вы увидите несколько примеров того, как люди справляются с этой проблемой. В частности, линии искажены, поэтому они не перекрывают друг друга или другие объекты на карте. Whuber в ответ на другой аналогичный вопрос (уже упоминалось в комментариях) является примером этого. Презентация некоторых исследователей в Стэнфорд демонстрирует эту же идею (Phan и др., 2005). Спасибо за эту презентацию, отправляемую dslamb за этот ответ в другой ветке (и все ответы на эту ветку будут также интересны для вашего вопроса). Мне особенно интересно, что один из кардинальных примеров этого - старая иммиграционная карта Минарда - пример желаемого результата (около 1864 года!).
Учитывая ваш конкретный вариант использования (небольшое количество узлов и линий), этого кажется достаточным. Другие «решения», которые я представляю, больше предназначены для визуализации данных с множеством строк и множеством мест назначения-назначения (хотя я предполагаю, что они будут полезны для сообщества в целом, поэтому я продолжу в любом случае).
Использование альфа-смешивания, цвета и ширины линии / высоты
Карты, которые я перечислил в том же потоке, ранее отмеченном, « Представление сетевых потоков» являются примерами этого. Друзья из Facebook - хороший пример настройки альфа-уровня линий, поэтому требуется гораздо больше потоков, чтобы представить более темную (или более яркую в этом случае) связь между двумя местами. Это также подчеркивает более длинные линии, потому что они, как правило, происходят реже. Аналогичная логика исходит из карт Value-by-Alpha для областей многоугольников (Roth et al., 2010), которые упоминались ранее на этом форуме .
Другая карта, которую я представляю в том же ответе, использует цвет и нетрадиционные трехмерные перспективные линии дуги (Ratti et al., 2010). Авторы использовали критерии кластеризации для группировки однородных областей и цветового кодирования их (поэтому, по определению, области в цвете имеют больше сходных структур потока, чем между цветами). Критерии кластеризации сами по себе могут быть интересны для определения закономерностей в данных, хотя, как упоминал Эндрю Гельман, кажется, что проблема в этом заключается в том, что она говорит вам в значительной степени то, что вы уже знаете, что приближает друг друга как правило, иметь больше связей.
Наконец, в эту категорию я включаю методы, которые взвешивают линии (аналогично альфа-смешиванию), используя либо ширину линии, либо в случае высоты трехмерной линии перспективы, чтобы передать объем потока. См. Страницу на странице программного обеспечения Tobler Flow Mapping для ознакомления с некоторыми примерами в 2d (а другая статья, которую я упомянул, является примером в 3d с использованием высоты строк). Также на этой странице Tobler имеет очень полезную статью, описывающую проблемы с отображением потоков и их историческое применение (Tobler, 1987).
Другой пример в 3d - это ответ mankoff на этом сайте. Этот пост в блоге «Социологические изображения» показывает полезный способ на блок-схеме различать входящие и исходящие потоки (хотя, опять же, это работает, потому что число узлов относительно небольшое, а узлы в сети можно расположить в произвольный способ уменьшить оверплоттинг). Те же типы стрел (и некоторые другие, использующие хеширование) также есть в (Tobler, 1987).
В конце концов, хотя ширина и цвет линии не решают проблему чрезмерного построения графика. Дуги в 3d несколько помогают, хотя с более сложными схемами потока я думаю, что они будут иметь ограниченную полезность. Альфа-смешивание ИМО, по-видимому, является наиболее полезным в самых разных ситуациях из этих трех, но цвет и ширину линии можно / нужно использовать в сочетании с искажением линии, упомянутым выше.
Сжатие данных
Здесь я группирую два типа методов: 1) использование небольших множественных карт (т. Е. Множество карт с меньшим количеством объектов для визуализации, поэтому избыточное построение сокращается), или 2) другие графические представления, которые не являются линиями, но представляют некоторые потоки через плотность или картограммы. Примеры их можно найти в (Corcoran et al., 2009; Rae, 2009; Wood et al., 2010) (спасибо iant за ссылку Rae). Они, как правило, уменьшают объем визуальной информации, представляемой либо представлением серии небольших множественных карт (или просто меньшей площади), либо используют схему сопоставления хороплетов для представления некоторой статистики (примерами могут быть число входных потоков, количество оттоков , направление потоков, среднее расстояние потоков). Если у вас есть данные точечного уровня, вы можете представить эти статистические данные с помощью растровых карт плотности ядра или объединить их в квадраты.
Когда информация уменьшается таким образом, переполнение не является такой большой проблемой. Очень интересный интерактивный онлайн-пример - карта миграции журнала Forbes . Вы можете видеть только один округ за раз, но сокращение информации значительно упрощает анализ строк (и разницы между входящими и исходящими потоками). В недавнем сообщении в блоге по картированию ESRI также используется похожая техника с небольшими коэффициентами (они также выбирают конкретную проекцию для карты мира, чтобы иметь «красивые» линии, и хорошо используют цвет для дальнейшего выделения различных международных источников). В этом примере это работает довольно хорошо, потому что конечное назначение одинаково для всех потоков, но если потоки могут быть взаимными, это, вероятно, также не сработает.
Использование других не связанных с картой представлений потоков
Другие на этом сайте предложили использовать альтернативные схемы реальной карте для представления потоков (просто отображая места происхождения и назначения другим способом, нежели их фактическое географическое местоположение). Примерами этого являются либо конкретные визуализации (например, созданные Circos ), дуговые диаграммы (см. Этот пример в Protovis, их также называют крискограммами (Xiao & Chun, 2009)), либо матричные тепловые карты ( вот еще один пример из Веб-сайт Protovis) Другим вариантом может быть использование некоторого типа автоматической компоновки сети для идентификации шаблонов в потоках (например, способных Graphviz ). Помимо Graphviz, похоже, Gephi, библиотека Python NetworkX и некоторые библиотеки R также являются популярными инструментами (см.этот ответ на сайте статистики).
Библиотеки, которые я цитирую, довольно крутые, поскольку они также разработали интерактивные визуализации. Вот пример с похожим стилем на круговую графику (хотя и не круговую!). Вот еще одна интерактивная визуализация, использующая некоторые из методов искажения линий, обсуждавшихся ранее, размещение в сети (которое похоже на круговые картограммы Дорлинга), а также другие полезные статистические сводки (оба этих примера я видел первоначально в блоге по информационной эстетике ).
Некоторые другие ресурсы, которые, на мой взгляд, полезны, - это программное обеспечение и статьи из лаборатории пространственного анализа данных и визуальной аналитики . Кроме того, моделирование спроса на преступные поездки в программе CrimeStat - это краткое введение в применимые методы регрессии для таких потоковых данных. Любой из этих инструментов может позволить вам выявить интересные корреляции в шаблонах потока с другой географической информацией. Еще одно место, где можно получить полезное вдохновение для графического отображения данных или статистического анализа, - недавний выпуск журнала «Вычислительная и графическая статистика», том 20, выпуск 2., при изучении статистики прибытия / вылета рейса для коммерческих перевозчиков в США с 1987 по 2008 год (если вы заинтересованы в обработке больших данных, это также стоило бы изучить). Все статьи бесплатны, и у них есть постеры с каждой газетой.
В конце данные и носитель будут определять, насколько хорошо некоторые из этих методов работают для уменьшения визуального беспорядка, который сопровождает данные потока. Я надеюсь, что это полезное место, чтобы найти идеи о том, как бороться с этой проблемой визуализации. Если вы доработаете свой вопрос до того, что вы хотите достичь, тогда другие могут дать полезную обратную связь в реальных программных реализациях (если что-то еще не доступно).
Цитирование
- Коркоран, Джонатан, Прем Четри и Роберт Стимсон. (2009) Использование круговой статистики для изучения географии пути на работу. Papers in Regional Science 88 (1): 119-132.
- Фан, Доантам, Лин Сяо, Рон Йе, Пэт Ханрахан и Терри Виноград. (2005) Схема схемы потока. In Information Visualization, 2005. INFOVIS 2005. IEEE Symposium : 219–224. | PDF здесь
- Рей, Аласдейр. (2009) От данных о пространственном взаимодействии к информации о пространственном взаимодействии? Геовизуализация и пространственные структуры миграции по переписи 2001 года в Великобритании. Компьютеры, окружающая среда и городские системы 33 (3): 161-178. | PDF здесь
- Ратти, Карло, Станислав Соболевский, Франческо Калабрезе, Клио Андрис, Джонатан Ридс, Мауро Мартино, Роб Клэкстон и Стивен Х. Строгац. (2010) Перерисовка карты Великобритании из сети человеческих взаимодействий. Занимается 5 (12). Статья является открытым доступом по ссылке
- Рот Роберт Э., Эндрю У. Вуддрафф и Захари Ф. Джонсон. (2010) Карты ценности по альфа: альтернативный метод картограмме. Картографический журнал 47 (2): 130-140. | PDF здесь
- Тоблер, Уолдо Р. (1987). Эксперименты по картированию миграции с помощью компьютера. Картография и географические информационные науки 14 (2): 155-163 | PDF здесь
- Вуд, Джо, Джейсон Дайкс и Эйдан Слингсби. (2010). Визуализация происхождения, пунктов назначения и потоков с картами OD. Картографический журнал 47 (2): 117-129. | PDF здесь
- Сяо, Ниньчуань и Юнван Чунь. (2009) Визуализация миграционных потоков с использованием крискограмм. Картография и географическая информатика 36 (2): 183-191.
* примечание, ссылки на документы без pdf включены, когда я смог найти