Боксовые выемки против интервала Тьюки-Крамера


10

«Зарубка» помощь документ ( или исходный текст ) из boxplot в «R» дает следующее:

Если выемки на двух участках не перекрываются, это является «убедительным доказательством» того, что две медианы различаются (Chambers et al, 1983, p. 62). Смотрите boxplot.stats для используемых расчетов.

и « boxplot.stats » дает следующее:

Пазы (если требуется) расширяются до +/- 1,58 IQR / sqrt (n). Кажется, это основано на тех же вычислениях, что и формула с 1,57 в Chambers et al (1983, с. 62), приведенная в McGill et al (1978, с. 16). Они основаны на асимптотической нормальности медианы и приблизительно равных размерах выборки для двух сравниваемых медиан и, как говорят, довольно нечувствительны к основным распределениям выборок. Идея состоит в том, чтобы дать примерно 95% доверительный интервал для разности двух медиан.

Теперь я более знаком с использованием JMP-версии теста Тьюки-Крамера для сравнения средних значений столбцов. Документация для JMP дает это:

Показывает тест, который рассчитан на все различия между средствами. Это тест Тьюки или Тьюки-Крамера HSD (честно значимая разница). (Tukey 1953, Kramer 1956). Этот тест является точным тестом альфа-уровня, если размеры образцов одинаковы, и консервативен, если размеры образцов различаются (Hayter 1984).

Вопрос: Какова природа связи между двумя подходами? Есть ли способ превратить одно в другое?

Похоже, что кто-то ищет приблизительный 95% ДИ для медианы и определяет, есть ли перекрытие; а другой - «точный альфа-тест» (мои образцы имеют одинаковый размер) для определения, находятся ли медианы двух наборов образцов в разумных пределах друг от друга.

Я ссылаюсь на пакеты, но меня интересует математика, лежащая в основе логики.

Ответы:


11

Что касается надреза в виде прямоугольника, ссылка на McGill et al [1], упомянутая в вашем вопросе, содержит довольно полные детали (не все, что я здесь говорю, здесь явно упоминается, но, тем не менее, достаточно подробно, чтобы понять это).

Интервал является робустифицированным, но основанным на гауссовском интервале

В статье указаны следующие интервалы для надрезов (где - медиана образца, а - межквартильный интервал образца):MR

M±1.7×1.25R/(1.35N)

где:

  • 1.35 - это коэффициент асимптотического преобразования, который превращает IQR в оценки - в частности, это приблизительно разница между квантилем 0,75 и квантилем 0,25 от стандартной нормали; квартили населения находятся на расстоянии около 1,35 , поэтому значение около должно быть последовательной (асимптотически несмещенной) оценкой (точнее, около 1,394).σσR/1.35σ

  • 1.25 приходит, потому что мы имеем дело с асимптотической стандартной ошибкой медианы, а не среднего значения. В частности, асимптотическая дисперсия выборочной медианы равна где - высота плотности в медиане. Для нормального распределения равно , поэтому стандартная асимптотическая ошибка выборочной медианы равна .14nf02f0f012πσ0.3989σ12Nf0=π/2σ/N1.253σ/N

    Как упоминает здесь СтасК , чем меньше , тем более сомнительным будет это (заменить его третью причину обоснованием использования нормального распределения в первую очередь).N

    Комбинируя два вышеупомянутых, мы получаем асимптотическую оценку стандартной ошибки медианы около . Макгилл и др. Приписывают это Кендаллу и Стюарту (я не помню, встречается ли там конкретная формула или нет, но компоненты будут).1.25R/(1.35N)

  • Так что все, что осталось обсудить, это коэффициент 1,7.

    Обратите внимание, что если бы мы сравнивали одну выборку с фиксированным значением (скажем, предполагаемой медианой), мы использовали бы 1,96 для 5% теста; следовательно, если бы у нас было две очень разные стандартные ошибки (одна относительно большая, одна очень маленькая), это было бы о факторе, который нужно использовать (так как если бы ноль был истинным, разница была бы почти полностью из-за вариации в той с большей стандартная ошибка, и небольшая ошибка (приблизительно) может рассматриваться как эффективно исправленная).

    С другой стороны, если бы две стандартные ошибки были одинаковыми, коэффициент 1,96 был бы слишком большим фактором, поскольку оба набора меток входят в него - для того чтобы два набора меток не перекрывались, мы добавляем одну из каждой. Это сделало бы правильный коэффициент асимптотически.1.96/21.386

    Где-то посередине, у нас 1,7 грубый компромиссный фактор. Макгилл и др. Описывают его как «эмпирически выбранный». Это довольно близко подходит к предположению о конкретном соотношении отклонений, поэтому я предполагаю (и это не более того), что эмпирический выбор (предположительно основанный на некотором моделировании) был между набором округлых значений для отклонений (например, 1: 1, 2: 1,3: 1, ...), из которых «лучший компромисс» из соотношения был затем вставлен в округленный до двух цифр , По крайней мере, это правдоподобный способ оказаться очень близко к 1,7.rr:11.96/1+1/r

Соединение их всех (1.35,1.25 и 1.7) дает около 1.57. Некоторые источники получают 1,58, вычисляя 1,35 или 1,25 (или оба) более точно, но в качестве компромисса между 1,386 и 1,96, что 1,7 не соответствует даже двум значащим цифрам (это просто приблизительное компромиссное значение), поэтому дополнительная точность бессмысленно (они могли бы просто округлить все до 1.6 и покончить с этим).

Обратите внимание, что здесь нет настройки для множественных сравнений.


Есть некоторые четкие аналогии в пределах доверия для разницы в HSD Тьюки-Крамера :

y¯iy¯j±qα;k;Nk2σ^ε1ni+1nj

Но учтите, что

  • это комбинированный интервал, а не два отдельных вклада в разницу (поэтому у нас есть термин в а не два, которые вносят по отдельности и и мы предполагаем постоянную дисперсию (поэтому мы не имеем дело с компромиссом с - когда у нас могут быть очень разные дисперсии - а не асимптотический случай )c.1ni+1njk.1nik.1nj1.961.96/2

  • это основано на средствах, а не на медианах (поэтому нет 1.35)

  • она основана на , которая базируется в свою очередь , на самой большой разницы средних (так что даже не любая 1,96 часть в этом, даже один разделенный на ). В отличие от этого, при сравнении нескольких коробочных графиков нет оснований полагать, что метки основаны на самой большой разнице в медиане, все это чисто попарно.q2

Таким образом, хотя некоторые идеи, лежащие в основе формы компонентов, в некоторой степени аналогичны, на самом деле они совершенно отличаются в том, что они делают.

[1] McGill, R., Tukey, JW и Larsen, WA (1978) Вариации коробочных участков. Американский статистик 32, 12–16.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.