Контрпримеры, где Медиана находится за пределами [Mode-Mean]


11

Эта статья выше моей лиги, но в ней говорится о теме, которая меня интересует, о связи между средним, модой и медианой. Это говорит:

Широко распространено мнение, что медиана унимодального распределения «обычно» между средним и модой. Однако это не всегда так ...

Мой вопрос : может ли кто-нибудь привести примеры непрерывных унимодальных (идеально простых) распределений, где медиана находится вне интервала [mode, mean]? Например, такой дистрибутив, как mode < mean < median.

=== РЕДАКТИРОВАТЬ =======

Уже есть хорошие ответы от Glen_b и Фрэнсиса, но я понял, что я действительно заинтересован в примере, где мода <среднее <медиана или медиана <среднее <мода (то есть и медиана находится за пределами [мода, означает] И медиана «на той же стороне», что и среднее значение для режима (т. е. для режима выше или ниже). Я могу принять ответы здесь, открыть новый вопрос или, может быть, кто-то может предложить решение здесь напрямую?


Нетрудно расширить ответ, чтобы охватить более ограниченный случай.
Glen_b

2
Посмотрите на рисунок 6 здесь: ww2.amstat.org/publications/jse/v13n2/vonhippel.html, который дает (непрерывный унимодальный) пример Вейбулла, где медиана не находится между модой и средним значением.
Мэтью Тауэрс

Ответы:


14

Конечно, нетрудно найти примеры - даже непрерывные унимодальные - где медиана не находится между средним и модальным.

  1. Рассмотрим из треугольного распределения видаf T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Теперь пусть будет смесью 60-40 и .T 1 - 4 T 2XT14T2

    Плотность выглядит следующим образом:X

    Смесь двух треугольных плотностей с медианой вне среднего модового интервала

    Среднее значение ниже 0, режим на 0, но медиана выше 0. Небольшая модификация этого приведет к примеру, где даже плотность (а не просто cdf) была непрерывной, но связь между мерами местоположения была то же самое (редактировать: см. 3. ниже).

  2. Обобщая, давайте поместим пропорцию (с ) полной вероятности в правый треугольник и пропорцию в левый треугольник (вместо 0,6 и 0,4). у нас было раньше). Далее, сделайте коэффициент масштабирования в левой половине а не (с ):0 < p < 1 ( 1 - p ) - β - 4 β > 0p0<p<1(1p)β4β>0

    плотность для обобщенного варианта этой смеси двух треугольных плотностей

    Предполагая теперь, что , медиана всегда будет в интервале, охватываемом прямоугольным треугольником, поэтому медиана будет превышать режим (который всегда будет оставаться в ). В частности, когда , медиана будет равна . 0p>1p>120 1-1/p>1211/2p

    Среднее значение будет при .(pβ(1p))/3

    Если то среднее значение будет ниже моды, а если среднее будет выше моды.β>p/(1p)β<p/(1p)

    С другой стороны, мы хотим, чтобы сохранял среднее значение ниже медианы.(pβ(1p))/3<11/2p

    Рассмотрим ; это ставит медиану выше моды.p=0.7

    Тогда будет удовлетворять поэтому среднее значение выше моды.β=2β<p/(1p)

    Медиана на самом деле составляет то время как среднее значение составляет . Следовательно, для и у нас есть мода <среднее <медиана.11/1.40.15480.72(0.3)30.0333p=0.7β=2

    (NB. Для согласованности с моими обозначениями переменная на оси x для обоих графиков должна быть а не но я не собираюсь возвращаться и исправлять ее.)xt

  3. Это пример, где сама плотность непрерывна. Он основан на подходе, описанном в пунктах 1. и 2. выше, но с заменой «скачка» на крутой склон (а затем вся плотность перевернулась примерно на 0, потому что я хочу, чтобы пример выглядел вправо).

    непрерывная кусочно-линейная плотность с медианой <среднее <мода

    [Используя подход «смеси треугольных плотностей», он может быть сгенерирован как смесь 3 независимых масштабированных вариаций треугольной формы, описанных в разделе 1. Теперь у нас есть 15% , 60% и 25% .]T13T25T3

    Как мы видим на диаграмме выше, среднее значение находится посередине, как и требовалось.


  1. Обратите внимание, что m_t_ упоминает Вейбулла в комментариях (для которых медиана находится вне интервала для небольшого диапазона параметра формы ). Это потенциально удовлетворительно, потому что это хорошо известное унимодальное непрерывное (и гладкое) распределение с простой функциональной формой.[mode,mean]k

    В частности, для малых значений параметра формы Вейбулла распределение является асимметричным, и мы имеем обычную ситуацию медианы между модой и средним значением, в то время как для больших значений параметра формы Вейбулла распределение является левосторонним. и мы снова имеем эту ситуацию «медиана в середине» (но теперь с модой справа, а не со средним значением). Между этими случаями находится небольшая область, где медиана находится за пределами интервала средней моды, а в середине этого значения среднее значение и мода пересекаются:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Выбирая удобные значения для параметра формы в интервалах, отмеченных (1) и (2) выше - те, где промежутки между статистикой местоположения примерно равны - мы получаем:

    Плотности Вейбулла с медианой за пределами среднего модового интервала

    Хотя они удовлетворяют требованиям, к сожалению, три параметра местоположения находятся настолько близко друг к другу, что мы не можем визуально различить их (все они попадают в один и тот же пиксель), что немного разочаровывает - случаи для моих предыдущих примеров гораздо более разделены. (Тем не менее, он предлагает ситуации для изучения с другими распределениями, некоторые из которых могут дать результаты, которые являются более визуально отличными.)


Это работает, спасибо. Из любопытства, что было бы подобным «треугольным распределением», где мода <означает <медиана? (здесь медиана <мода <среднее)
Джантхельм

На самом деле в моем исходном примере имеется в виду <режим <медиана; у вас были неравенства назад. Теперь я добавил аналогичный пример, где среднее значение выше моды, но ниже медианы (действительно, вы могли бы просто заменить исходный скажем, и сохранить пропорции смеси на уровне для правой части и для левая часть). 4T21.25T20.60.4
Glen_b

6

Следующий пример взят из контрпримеров Джордана Стоянова по вероятности .

Учитывая положительную постоянную и , рассмотрим случайную величину с плотностью Среднее значение , медиана и мода для можно найти как Примечание является плотностью, только если Поэтому, если мы допустим то . В результате, если мы выберем это близко кcλX

f(x)={ceλ(xc),x(c,)x,x(0,c]0,x(,0].
μmMXf ( x ) c 2
μ=c33+c2λ+cλ2,m=1,M=c.
f(x)c
c22+cλ=1.
А , 2 с > 1 1 1,0001 μ > с М = с м μ Мc1λ2c>11 (скажем ), мы можем обнаружить , что и , так что медиана не падает между и .1.0001μ>cM=cmμM

0

Возьмите экспоненциальное распределение с параметром скорости a и плотностью a exp (-ax) для 0 <= x <бесконечность. Режим в нуле. Конечно, среднее значение и медиана больше 0. Cdf - 1-exp (-ax). Поэтому для медианы решите для exp (-ax) = 0,5 для x. Тогда -ax = ln (0.5) или x = -ln (0.5) / a. Для среднего интегрируем ax exp (-ax) от 0 до бесконечности. Возьмем a = 1, и мы имеем медиану = -ln (0.5) = ln (2) и среднее значение = 1.

Таким образом, режим <средний <средний.


1
Извините, но разве мы не ищем распределения, где мода <означает <медиана (или, в более общем случае, где медиана находится за пределами [мода, средняя])?
Джантхельм

3
Извините за путаницу, я добавил к исходному вопросу, но первоначально я спрашивал примеры, где медиана находится вне [mode, mean], а я думаю, что медиана находится внутри [mode, median] в вашем примере.
Джантхельм

3
Майкл, вопрос не задает случай, когда медиана находится между модой и средним. Вы неверно цитируете оригинал в своем комментарии чуть выше этого; вопрос не говорит «mode <median <mean», когда вы заявляете, что он делает (и никогда не делал этого ни в какой момент в истории редактирования). В результате ваш ответ содержит случай, который не запрашивается; действительно, это обычная ситуация (медиана в середине двух других), из которой вопрос ищет исключения. Почти любое известное перекошенное унимодальное распределение имеет медиану в середине - хитрость заключается в том, чтобы найти те, которые этого не делают.
Glen_b

1
Историю редактирования можно получить, нажав на красную ссылку в нижней части вопроса, где в настоящее время написано «отредактировано 18 часов назад» (она изменилась на 19, когда я печатал эти комментарии). Вы можете увидеть историю изменений, нажав там. Вопрос был опубликован 22 часа назад (как я сейчас набираю), и когда вы нажимаете на историю изменений, этот оригинальный вопрос можно увидеть внизу с пометкой «1». Ваш ответ появился примерно через 2 часа (20 часов назад), когда это было тем же вопросом. Примерно через 1-2 часа после вашего сообщения ОП отредактировал свой вопрос один раз, что видно ...
Glen_b

1
ctd ... наверху истории редактирования .. После каждого редактирования есть двухминутное окно для внесения изменений, которые считаются частью этого редактирования (то есть 22 часа назад и 18-19 часов назад было два минутное окно каждый раз, когда говорят, что опечатка могла быть исправлена), но ~ 20 часов назад, когда вы отправляли сообщение, вопрос не менялся в течение примерно 2 часов, и он оставался неизменным в течение более часа после публикации, когда основное редактирование ( показано в истории редактирования). Любые изменения вне этих коротких двухминутных окон после редактирования будут в истории редактирования.
Glen_b
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.