Делая некоторые EDA, я решил использовать рамочный график, чтобы проиллюстрировать разницу между двумя уровнями фактора.
Способ, которым ggplot отображал рамочный график, был удовлетворительным, но немного упрощенным (первый график ниже). Изучая характеристики коробочных участков, я начал экспериментировать с выемками.
Я понимаю, что метки отображают CI вокруг медианы, и что если две метки «метки не перекрывают друг друга, есть« убедительные доказательства »- при уровне достоверности 95% - медианы отличаются.
В моем случае (второй график) вырезы не имеют значительного перекрытия. Но почему нижняя часть коробки с правой стороны принимает эту странную форму?
Отображение тех же данных на графике скрипки не указывало на необычность плотности вероятности соответствующей скрипки.

ggplot2. Мне также нравится идея построения отдельных точек данных, но она разочарована тем, что точки внутри темного блока становятся невидимыми.