Я бы сказал, что с такими данными вам действительно нужно показывать результаты в преобразованном масштабе. Это первый императив и более важный вопрос, чем именно то, как нарисовать прямоугольник.
Но я повторяю Фрэнку Харреллу, призывая к чему-то более информативному, чем минимальный сюжет, даже с некоторыми крайними точками. У вас достаточно места, чтобы показать гораздо больше информации. Вот один из многих примеров: гибридная коробка и квантильный сюжет. Как и в ваших данных, сравниваются две группы.
Я возьму эти два пункта один за другим и скажу больше.
Преобразованная шкала
В простейшем случае все ваши значения могут быть положительными, и вам следует сначала попробовать использовать логарифмическую шкалу.
Если у вас есть точные нули, масштаб квадратного корня или кубического корня все еще улучшит крайнюю асимметрию. Некоторые люди довольны log (значение + константа), где константа чаще всего равна 1, как способ справиться с нулями.
Последствия для коробчатых участков использования трансформированной шкалы невелики.
Если вы используете общее соглашение Тьюки, согласно которому все точки за пределами верхнего квартиля + 1,5 IQR или нижнего квартиля - 1,5 IQR отображаются по отдельности, то, вероятно, эти пределы следует рассчитывать по преобразованной шкале. Это не то же самое, что вычисление этих пределов в исходном масштабе, а затем преобразование.
Вместо этого я бы поддержал, как представляется, соглашение меньшинства о выборе квантилей для целей усов. Одним из нескольких преимуществ этого является то, что преобразование квантиль = квантиль преобразования, по крайней мере, достаточно близко для графических целей в большинстве случаев. (Мелкий шрифт - всякий раз, когда квантили рассчитываются путем линейной интерполяции между статистикой смежного порядка.)
Это квантильное соглашение было предложено довольно заметно Кливлендом (1985). Для справки: в географии и климатологии были использованы расширенные коробчатые графики с коробками для квартилей, более тонкие коробки с внешними осциллами (точки 12,5 и 87,5%) и (например) Мэтьюзом (1936) и Гроувом (1956) в разделе географии и климатологии. название "дисперсионные диаграммы".
Больше, чем коробочные участки
Коробочные сюжеты были заново изобретены Тьюки в 1970 году и наиболее заметно продвинуты в его книге 1977 года. Большая часть его цели состояла в том, чтобы продвинуть графы, которые могли быть быстро нарисованы, используя ручку (cil) и бумагу в неофициальном исследовании. Он также предлагал способы выявления возможных выбросов. Это было хорошо, но теперь у нас у всех есть доступ к компьютерам, безболезненно составлять графики, показывающие, если не все данные, то, по крайней мере, гораздо больше деталей. Сводная роль блочных графиков ценна, но график может также показать тонкую структуру, на случай, если она будет интересной или важной. (И то, что исследователи считают неинтересным или неважным, может быть более поразительным для их читателей.)
Есть много места для вежливых разногласий по поводу того, что именно работает лучше всего, но, на мой взгляд, голые участки были перепроданы.
Пользователи Stata могут найти больше о программе, которая нарисовала фигуру в этом посте Statalist . Пользователи другого программного обеспечения не должны испытывать затруднений при рисовании чего-то хорошего или лучшего (иначе зачем использовать это программное обеспечение?).
Cleveland, WS 1985. Элементы графического отображения данных. Монтерей, Калифорния: Уодсворт.
Grove, AT 1956. Эрозия почвы в Нигерии. В Steel, RW и Fisher, CA (Eds)
Географические очерки о британских тропических землях. Лондон: Джордж Филипп, 79-111.
Мэтьюз, HA 1936. Новый взгляд на некоторые знакомые индийские дожди. Шотландский географический журнал 52: 84-97.
Tukey, JW 1977. Исследовательский анализ данных. Чтение, Массачусетс: Аддисон-Уэсли.