Эффективное отображение демографических данных на печатной карте


29

Я хотел бы представить следующие данные для каждой зоны (всего 30 зон) на печатной / неинтерактивной карте:

  • Средний возраст
  • Средний доход домохозяйства
  • Количество домохозяйств
  • Плотность населения
  • Число людей
  • Количество работников

Как бы вы эффективно отобразили 6 слоев на одной карте?


1
Насколько велики зоны относительно размера страницы? Можете ли вы разместить небольшой участок в каждой зоне? (например, радиолокационная карта)
djq

@celenius -Это типичный тип переписи, когда центральные районы намного меньше жилых зон, которые значительно меньше, чем пригородные / сельские зоны
Дассуки

1
Эти 6 слоев на статической карте - сложная задача проектирования. В чем проблема, препятствующая использованию интерактивной карты?
Trevesy

@Trevesy - по большей части необходимо разработать карту для печати, в которой выделены 6 переменных, чтобы способствовать визуальному анализу
Дассоуки

1
Я позволил себе добавить тег визуализации, не стесняйтесь удалять его, если считаете его неуместным.
Энди W

Ответы:


20

Я бы сказал, что вы не можете включить все эти данные в одну карту, и в этом есть какой-то смысл. Я бы порекомендовал вам подумать в соответствии с принципом Туфте о малых коэффициентах, имеющих несколько меньших карт одной и той же области, каждая из которых использует свою переменную. Пример: http://www.juiceanalytics.com/writing/better-know-visualization-small-multiples/

Даже тогда у вас есть проблема, что вы используете кучу разных юнитов, поэтому вам нужна куча ключей. Другим способом просмотра данных (но не на карте) будет использование таблицы со всеми цветными значениями (т. Е. Разными цветами для значений ниже среднего, среднего и выше среднего)

Также рекомендую вам посмотреть атлас переписей для получения дополнительной информации о картах: http://www.census.gov/population/www/cen2000/censusatlas/

Может помочь отразить больше на том, какое сообщение вы пытаетесь передать, а не только на том, какие данные у вас есть.


5
+1 Это гораздо лучше, чем создавать беспорядок, пытаясь символизировать шесть переменных одновременно. Кроме того, почему бы не распечатать таблицу данных? Шесть столбцов + идентификатор, 30 строк: это достаточно мало и дает всю необходимую информацию.
whuber

13

Невозможно эффективно отображать столько данных на одной карте. Две возможности:

  • Изготовить 6 карт,

  • Проанализируйте свои данные, чтобы классифицировать ваши регионы и отобразить результат классификации. Анализ главных компонентов может помочь определить наиболее важные корреляции в вашей переменной. Этот метод был использован для создания этой синтетической карты:

альтернативный текст

из этих:

альтернативный текст альтернативный текст


Проблема с наличием 6 карт заключается в том, что визуально определить какие-либо тенденции сложно. Иногда приятно посмотреть на карту с несколькими переменными и посмотреть, как все выстроится
dassouki

2
@dassouki, чтобы увидеть, как все выстраивается, вам не обязательно их отображать. Двумерные диаграммы рассеяния соответствовали бы этим критериям, и их было бы намного легче интерпретировать.
Энди W

3
Преимущество наличия 6 карт является то , что это легко визуально определить тенденции! Когда вы пытаетесь собрать шесть (или более) переменных в одну карту, может быть трудно найти шаблоны. (Если бы эта карта включала в себя тысячи функций, я бы изменил это замечание: некоторые виды отображений, такие как визуализация глифов , могут быть чрезвычайно эффективными для поиска шаблонов в богато многомерных наборах данных: lmi.bwh.harvard.edu/papers/papers/ KindlmannTVCG2006.html )
whuber

@julien, Классная штука, вам может быть интересна эта статья, с которой я только что сталкивался, e-publications.org/ims/submission/index.php/AOAS/user/… , у нее есть карты со связанным анализом PCA аналогичного многовариантного данные, а также R-код для построения графиков.
Энди W

Действительно интересно, мне придется прочитать об этом.
neuhausr

9

Я согласен, что небольшие кратные, вероятно, являются хорошим способом решения этой проблемы. В дополнение к карте я бы также предложил матрицу рассеяния с вашими переменными, которая идентифицировала бы двумерные корреляции. Хотя вы теряете географический аспект ваших данных, гораздо проще визуализировать отношения между переменными на диаграмме рассеяния, чем сравнивать две карты (даже бок о бок).

Если вы все еще хотите, чтобы захватывались какие-то пространственные тренды, вы можете включить пространственную статистику (например, локальный Моран I) между распределениями и / или исходными переменными.

Редактировать: я недавно натолкнулся на некоторые работы, посвященные пересмотру моральной статистики, опубликованной Андре-Мишелем Герри (первоначально в 1883 году), целью которой является визуализация многовариантных отношений в пространстве. Реализации этих авторов очень похожи на то, что было предложено в этой теме: небольшие кратные, анализ главных компонентов, матрицы диаграмм рассеяния и диаграммы полигонов. Приложены некоторые фотографии из А.-М. Моральная статистика Герри во Франции: проблемы многомерного пространственного анализа : Michael Friendly Statistical Science, Vol. 22, № 3. (август 2007 г.), с. 368-399 ( PDF бесплатно). Также другая статья ( Dray and Jombart, 2010 ) анализирует те же данные и имеет некоторый исходный код на R для составления указанных графиков.

Одна картина представляет собой матрицу диаграммы рассеяния, другая - это то, что называется звездной диаграммой (это просто другой способ представления гистограмм, как предложил Пабло). альтернативный текст альтернативный текст


8

Вот замечательный пример небольших мультипликаторов, размещенных в статистическом моделировании Эндрю Гельмана (и блоге компании) , причинно-следственной связи и социальных науках . На карте предусмотрена поддержка избирателями школьных ваучеров в зависимости от уровня дохода и различных рас и религий. Белым неевангеликам действительно не нравятся школьные ваучеры! (Если вы перейдете к реальному блогу, хотя он появляется в данных опроса 2004 года, это больше поддерживает школьные ваучеры в этой группе). введите описание изображения здесь


График классный, но цветовая гамма ужасная. Почему 50% так расставлены по приоритетам, сделав его серым? Конечно, он должен просто использовать цвета карты тепла, или что-то? Кроме того, почему только люди разделяются на религию? Конечно, было бы более разумно разделить по расе, а затем по религии?
naught101

@ naught101, я немного смущен твоим негативом. Безусловно, серый лишен внимания по сравнению с более яркими или более темными цветами на обоих концах спектра. В то время как я не согласен с произвольным расхождением в 45%, IMO при создании небольших таких карт очень полезно иметь очень контрастные значения. Комментарии по поводу расы религии / расы тоже не имеют большого смысла. Это категории , которые, очевидно, тесно связаны с тем, поддерживает ли индвидиум ваучеры, и кажется, что некоторые из предложенных вами подмножеств не существуют. продолжение ...
Энди Ш

То есть я очень сомневаюсь, что в опросе достаточно «черных католиков», чтобы сказать что-либо существенное о такой группе (ни о «латиноамериканских протестантах, не являющихся евангантами»). Я бы предложил вам прочитать пост Гельмана и, надеюсь, это прояснит мотивацию для подгруппы.
Энди W

возможно это - только что определенный серый отталкивает на моем экране. Я думаю, что было бы лучше с белым, и, возможно, серым фоном, чтобы отличить его. Также стоит отметить, что два изображения в блоге Гельмана имеют разные масштабы ... У меня сложилось впечатление, что численность чернокожего населения была намного выше, но я просто посмотрел данные переписи и постарался исправить. Одна странность в том, что перепись определяет происхождение латиноамериканцев как ортогональное к расе (это отдельный вопрос). Я думаю, что различия Гельмана определены по-другому ..
Naught101

@ naught101 это не информация из переписи, это из какого-то другого опроса (перепись не имеет ничего общественного мнения по этому поводу)
Энди W

5

Чтобы выбрать между решениями, представленными здесь, вы можете предоставить две ключевые информации:

  • какова цель карты? (Откройте для себя, разоблачить?)
  • Какова предполагаемая публика карты? (Вы, коллеги-аналитики, градостроитель, публика?)

Решения, приведенные здесь, могут иметь различную эффективность в зависимости от цели и общественности.

Я хотел бы обобщить ответ Жюльена (одна синтетическая карта посредством PCA), сославшись на метод диагонализации матрицы, описанный Дж. Бертином. Это полезно, когда нужно искать обобщение всей информации, а не полное представление данных.

Вкратце, он состоит в представлении каждой переменной с помощью гистограммы, сортировку стека гистограмм таким образом, чтобы значения (зоны карты) были выровнены по диагонали, чтобы получить типологию:

альтернативный текст

(Источник: http://books.google.com/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20information&hl=fr&source=gbs_s Similarbooks )


4

Это много информации, и факт, что единственная карта, объединяющая их все тематически, приведет к бесполезному представлению из-за визуального загрязнения. С другой стороны, существует 30 зон, поэтому множество карт для каждой зоны также может привести к загрязнению.

Мое решение: выберите наиболее важную информацию, скажем, «доход домохозяйства», затем разбейте карту на категории по доходам. И, наконец, для каждого места дохода, построите чат-бар с другими 5 атрибутами.

С помощью этой карты можно сделать некоторые сравнения, например, например: «В районах с высоким уровнем дохода всегда присутствует большое количество работников и средний возраст более 21 года».

Посмотрите на пример...

альтернативный текст


4

Возможно, некоторые из этих идей могли бы помочь?

Предполагая, что у вас есть шесть измерений:

1: Choropleth : пример дохода домохозяйства 0

2, 3 и 4: Символы : представление числа людей в виде точек, которые могут позволить вам видеть фон: пример 1, пример 2 с использованием оттенков серого для рабочих / неработающих и другой цветовой схемы для отображения возраста

5: 3D : использование плотности населения в качестве примера местности 3

6: (Я не могу думать о 6-м пути!)

Излишне ли указывать «Количество домохозяйств», «Плотность населения» и «Количество людей»?

Я бы скептически отнесся к тому, чтобы карта с такой сложностью была понятна любому, кроме вас. Если бы я представлял его, я бы сначала показывал каждый элемент отдельно, а затем добавлял его, чтобы аудитория могла понять шаги.


Один из альтернативных способов (если у вас нет места для радиолокационной диаграммы для каждой зоны, может быть создание «глифа», представляющего этот информационный пример 4, рис. 10.28 . Я думаю, что их обычно трудно понять, и их нелегко спроектировать ясно, но связанный пример может быть использован в этом случае.


Еще одна мысль, которая у меня была, состоит в том, чтобы вытянуть многоугольники на одинаковую высоту для каждого многоугольника, а затем использовать часть высоты для представления этих параметров. Аналогично созданию гистограммы для каждой области, но где каждый раздел наслоен сверху с одинаковыми интервалами. Это нужно будет смотреть из 3D, что будет означать, что некоторые из них будут скрыты.


Я люблю и имею в виду все ваши предложения. Я планирую реализовать 1-> 4. Однако для материала 3d: я обнаружил, что когда вы делаете 3d карты, центральные районы, обычно расположенные в центре, получают большую часть возвышения, блокируя множество зон позади них
dassouki

@dassouki - я согласен, что это обычно так. Возможно, вы могли бы использовать переменную, которая не имеет большого диапазона для этого (среднего возраста?), Или, если это так, вы могли бы логарифмически преобразовать ее.
DJQ

3
@celenius Интересный вопрос о возможной избыточности: плотность населения - это количество людей по отношению к площади ; количество людей - это абсолютный счет; а количество домохозяйств дает информацию о том, как люди живут вместе. Хотя очевидно, что эти три переменные связаны (и могут создавать проблемы почти коллинеарности в регрессиях), на самом деле они представляют собой три разных элемента информации. Кстати, это "choropleth". (К счастью, Google распознает эту опечатку и в любом случае выполняет предполагаемый поиск.)
whuber

1
@whuber - я думаю, что это, вероятно, сделано с помощью вспышки (к сожалению!).
djq

2
Я очень подозрительно отношусь к предложению 3D. AFAIK никто не показал, 3D очень удобно. Связь с преступностью в Сан-Франциско работает, но только потому, что она очень проста - более сложную модель трудно будет расшифровать. Я не думаю, что в этом случае вообще стоит использовать 3D.
Trevesy

2

Это сложная задача. Мой ответ - использовать многомерную карту. Проверьте эту карту . Карта будет выглядеть занятой, если вы покажете все переменные на одной карте. Убедитесь, что вы выбрали подходящую цветовую схему, если решите использовать многомерную карту.


Документы Google заблокированы, где я работаю :(
dassouki


не работает, и я не могу очистить его, если у него нет расширения файла в конце этого
dassouki

До

это блок с моей стороны. :( Я не против отправить вам карту по электронной почте.
Raj

0

Одна степень упрощения будет заключаться в выражении одного элемента, такого как плотность населения, через картограмму, т.е. искажать площадь каждой единицы так, чтобы она была пропорциональна населению:

Президентские выборы в США 2008
(источник: amherst.edu )

Основным недостатком является то, что зритель должен иметь возможность распознавать искажение зон от их «обычных» форм.

Более подробная информация здесь: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
Я думаю, что это имеет потенциал, но неясно, насколько хорошо картограммы могут быть применены к этой конкретной ситуации (одновременный просмотр нескольких атрибутов в одном и том же пространстве). Теоретически вы можете составить много маленьких картограмм, но это может быть трудно интерпретировать (вы теряете согласованность между картами, что очень важно для небольших мультипликаторов). Возможно, картограмму можно комбинировать с цветом более интересными способами, чтобы показать несколько атрибутов.
Энди W

1
Пример маленьких картограмм, gisandscience.com/2011/12/07/…
Энди У,
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.