Что касается надреза в виде прямоугольника, ссылка на McGill et al [1], упомянутая в вашем вопросе, содержит довольно полные детали (не все, что я здесь говорю, здесь явно упоминается, но, тем не менее, достаточно подробно, чтобы понять это).
Интервал является робустифицированным, но основанным на гауссовском интервале
В статье указаны следующие интервалы для надрезов (где - медиана образца, а - межквартильный интервал образца):MR
M±1.7×1.25R/(1.35N−−√)
где:
1.35 - это коэффициент асимптотического преобразования, который превращает IQR в оценки - в частности, это приблизительно разница между квантилем 0,75 и квантилем 0,25 от стандартной нормали; квартили населения находятся на расстоянии около 1,35 , поэтому значение около должно быть последовательной (асимптотически несмещенной) оценкой (точнее, около 1,394).σσR/1.35σ
1.25 приходит, потому что мы имеем дело с асимптотической стандартной ошибкой медианы, а не среднего значения. В частности, асимптотическая дисперсия выборочной медианы равна где - высота плотности в медиане. Для нормального распределения равно , поэтому стандартная асимптотическая ошибка выборочной медианы равна .14nf20f0f012π√σ≈0.3989σ12N√f0=π/2−−−√σ/N−−√≈1.253σ/N−−√
Как упоминает здесь СтасК , чем меньше , тем более сомнительным будет это (заменить его третью причину обоснованием использования нормального распределения в первую очередь).N
Комбинируя два вышеупомянутых, мы получаем асимптотическую оценку стандартной ошибки медианы около . Макгилл и др. Приписывают это Кендаллу и Стюарту (я не помню, встречается ли там конкретная формула или нет, но компоненты будут).1.25R/(1.35N−−√)
Так что все, что осталось обсудить, это коэффициент 1,7.
Обратите внимание, что если бы мы сравнивали одну выборку с фиксированным значением (скажем, предполагаемой медианой), мы использовали бы 1,96 для 5% теста; следовательно, если бы у нас было две очень разные стандартные ошибки (одна относительно большая, одна очень маленькая), это было бы о факторе, который нужно использовать (так как если бы ноль был истинным, разница была бы почти полностью из-за вариации в той с большей стандартная ошибка, и небольшая ошибка (приблизительно) может рассматриваться как эффективно исправленная).
С другой стороны, если бы две стандартные ошибки были одинаковыми, коэффициент 1,96 был бы слишком большим фактором, поскольку оба набора меток входят в него - для того чтобы два набора меток не перекрывались, мы добавляем одну из каждой. Это сделало бы правильный коэффициент асимптотически.1.96/2–√≈1.386
Где-то посередине, у нас 1,7 грубый компромиссный фактор. Макгилл и др. Описывают его как «эмпирически выбранный». Это довольно близко подходит к предположению о конкретном соотношении отклонений, поэтому я предполагаю (и это не более того), что эмпирический выбор (предположительно основанный на некотором моделировании) был между набором округлых значений для отклонений (например, 1: 1, 2: 1,3: 1, ...), из которых «лучший компромисс» из соотношения был затем вставлен в округленный до двух цифр , По крайней мере, это правдоподобный способ оказаться очень близко к 1,7.rr:11.96/1+1/r−−−−−−√
Соединение их всех (1.35,1.25 и 1.7) дает около 1.57. Некоторые источники получают 1,58, вычисляя 1,35 или 1,25 (или оба) более точно, но в качестве компромисса между 1,386 и 1,96, что 1,7 не соответствует даже двум значащим цифрам (это просто приблизительное компромиссное значение), поэтому дополнительная точность бессмысленно (они могли бы просто округлить все до 1.6 и покончить с этим).
Обратите внимание, что здесь нет настройки для множественных сравнений.
Есть некоторые четкие аналогии в пределах доверия для разницы в HSD Тьюки-Крамера :
y¯i∙−y¯j∙±qα;k;N−k2–√σˆε1ni+1nj−−−−−−−√
Но учтите, что
это комбинированный интервал, а не два отдельных вклада в разницу (поэтому у нас есть термин в а не два, которые вносят по отдельности и и мы предполагаем постоянную дисперсию (поэтому мы не имеем дело с компромиссом с - когда у нас могут быть очень разные дисперсии - а не асимптотический случай )c.1ni+1nj−−−−−−√k.1ni−−√k.1nj−−√1.961.96/2–√
это основано на средствах, а не на медианах (поэтому нет 1.35)
она основана на , которая базируется в свою очередь , на самой большой разницы средних (так что даже не любая 1,96 часть в этом, даже один разделенный на ). В отличие от этого, при сравнении нескольких коробочных графиков нет оснований полагать, что метки основаны на самой большой разнице в медиане, все это чисто попарно.q2–√
Таким образом, хотя некоторые идеи, лежащие в основе формы компонентов, в некоторой степени аналогичны, на самом деле они совершенно отличаются в том, что они делают.
[1] McGill, R., Tukey, JW и Larsen, WA (1978) Вариации коробочных участков. Американский статистик 32, 12–16.