Делая некоторые EDA, я решил использовать рамочный график, чтобы проиллюстрировать разницу между двумя уровнями фактора.
Способ, которым ggplot отображал рамочный график, был удовлетворительным, но немного упрощенным (первый график ниже). Изучая характеристики коробочных участков, я начал экспериментировать с выемками.
Я понимаю, что метки отображают CI вокруг медианы, и что если две метки «метки не перекрывают друг друга, есть« убедительные доказательства »- при уровне достоверности 95% - медианы отличаются.
В моем случае (второй график) вырезы не имеют значительного перекрытия. Но почему нижняя часть коробки с правой стороны принимает эту странную форму?
Отображение тех же данных на графике скрипки не указывало на необычность плотности вероятности соответствующей скрипки.
ggplot2
. Мне также нравится идея построения отдельных точек данных, но она разочарована тем, что точки внутри темного блока становятся невидимыми.