У меня возникают трудности с выбором правильного способа визуализации данных. Допустим, у нас есть книжные магазины , в которых продаются книги , и у каждой книги есть хотя бы одна категория .
Для книжного магазина, если мы посчитаем все категории книг, мы получим гистограмму, которая показывает количество книг, которые попадают в определенную категорию для этого книжного магазина.
Я хочу визуализировать поведение книжного магазина, я хочу видеть, предпочитают ли они категорию по сравнению с другими категориями. Я не хочу видеть, одобряют ли они все вместе фантастику, но я хочу видеть, относятся ли они к каждой категории одинаково или нет.
У меня ~ 1 млн книжных магазинов.
Я подумал о 4 методах:
Пример данных, показать только 500 гистограмм книжного магазина. Показать их на 5 отдельных страницах с использованием сетки 10х10. Пример сетки 4х4:
То же, что № 1 Но на этот раз сортируйте значения по оси x в соответствии с их счетом desc, поэтому, если есть предпочтение, это будет легко увидеть.
Представьте себе, что вы помещаете гистограммы в # 2 вместе, как колоду, и показывает их в 3D. Что-то вроде этого:
Вместо того, чтобы использовать третью ось, выбирающую цвета для представления цветов, используйте тепловую карту (2D-гистограмму):
если книжные магазины обычно предпочитают одни категории другим, это будет отображаться в виде хорошего градиента слева направо.
Есть ли у вас какие-либо другие идеи / инструменты визуализации для представления нескольких гистограмм?