В моей области обычным способом построения парных данных является серия тонких наклонных отрезков, накладывающих их на медиану и КИ медианы для двух групп:
Однако этот тип графика становится намного сложнее для чтения, так как количество точек данных становится очень большим (в моем случае у меня порядка 10000 пар):
Уменьшение альфы немного помогает, но все же это не так здорово. В поисках решения я наткнулся на эту статью и решил попробовать реализовать «график параллельных линий». Опять же, это очень хорошо работает для небольшого числа точек данных:
Я полагаю, что мог бы отдельно показать распределения для двух групп, например, с коробочными диаграммами или скрипками, и построить линию с полосами ошибок вверху, показывающую два медианы / КИ, но мне действительно не нравится эта идея, так как она не будет передавать парный характер данных.
Я также не слишком заинтересован в идее двумерной диаграммы рассеяния: я бы предпочел более компактное представление, в идеале такое, в котором значения для двух групп изображены вдоль одной оси. Для полноты, вот как данные выглядят как двумерный разброс:
Кто-нибудь знает лучший способ представления парных данных с очень большим размером выборки? Не могли бы вы связать меня с некоторыми примерами?
редактировать
Извините, я явно недостаточно хорошо объяснил, что я ищу. Да, график 2D-разброса работает, и есть много способов улучшить его, чтобы лучше передать плотность точек - я мог бы раскрасить точки в соответствии с оценкой плотности ядра, я мог бы сделать гистограмму 2D Я мог бы построить контуры поверх точек и т. Д. И т. Д.
Тем не менее, я думаю, что это излишне для сообщения, которое я пытаюсь передать. Меня не очень интересует показ 2D плотности точек как таковой - все, что мне нужно сделать, это показать, что значения для «баров», как правило, больше, чем для «точек», настолько простым и понятным, насколько это возможно. и без потери существенного парного характера данных. В идеале я хотел бы построить парные значения для двух групп вдоль одной, а не ортогональной оси, поскольку это облегчает визуальное сравнение их.
Возможно, нет лучшего варианта, чем точечная диаграмма, но я хотел бы знать, есть ли альтернативы, которые могут сработать.
bar
на горизонтальной иdot
вертикальной оси в виде диаграммы рассеяния?