Эмпирические отношения между средним, медианой и модой


40

Для унимодального распределения, которое умеренно искажено, мы имеем следующие эмпирические отношения между средним, медианой и модой: Как были эти отношения получен?

(Mean - Mode)3(Mean - Median)

Карл Пирсон нарисовал тысячи таких отношений до того, как сформировал этот вывод, или есть логическая линия рассуждения за этими отношениями?

Ответы:


29

Обозначим среднее ( среднее), медиану, \ sigma стандартное отклонение и M мод. Наконец, пусть X - образец, реализация непрерывного унимодального распределения F, для которого существуют первые два момента.m σ M X FμmσMXF

Хорошо известно, что

(1)|μm|σ

Это частое учебное упражнение:

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
Первый равенство вытекает из определения среднего значения, то третье происходит потому , что медиана является уникальным minimiser (среди всех c «ами) E|Xc|и четвертое из неравенства Дженсена (т. е. определение выпуклой функции). На самом деле, это неравенство можно ужесточить. Фактически для любого F , удовлетворяющего приведенным выше условиям, можно показать [3], что

(2)|mμ|0.6σ

Хотя в общем случае неверно ( Abadir, 2005 ), что любое унимодальное распределение должно удовлетворять одному из все же можно показать, что неравенство

Mmμ or Mmμ

(3)|μM|3σ

справедливо для любого унимодального квадратично интегрируемого распределения (независимо от перекоса). Это доказано формально в Johnson and Rogers (1951), хотя доказательство зависит от многих вспомогательных лемм, которые здесь трудно уместить. Пойди посмотри оригинальную статью.


Достаточное условие для распределения удовлетворяющего , дано в [2]. Если :μ m M FFμmMF

(4)F(mx)+F(m+x)1 for all x

затем . Кроме того, если , то неравенство строгое. Распределения Пирсона типа I - XII являются одним примером семейства распределений, удовлетворяющих [4] (например, Вейбулл - это одно общее распределение, для которого не выполняется, см. [5]).μ m ( 4 ) ( 4 )μmMμm(4)(4)

Теперь, предполагая, что строго соблюдается и записывая, что , мы имеем σ = 1 3 ( m - μ ) ( 0 , 3 (4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

и поскольку второй из этих двух диапазонов не пуст, безусловно, можно найти распределения, для которых утверждение верно (например, когда ) для некоторого диапазона значений параметров распределения, но это не верно для всех распределений и даже не для всех распределений, удовлетворяющих .(4)0<mμ<33<σ=1(4)

  • [0]: Проблема моментов для унимодальных распределений. Н.Л. Джонсон и К.А. Роджерс. Анналы математической статистики. 22, № 3 (сентябрь 1951 г.), стр. 433-439.
  • [1]: Неравенство средней медианной моды: контрпримеры Карим М. Абадир Эконометрическая теория, вып. 21, № 2 (апрель 2005 г.), с. 477-482.
  • [2]: WR van Zwet, Среднее значение, медиана, режим II, статистика. Neerlandica, 33 (1979), стр. 1-5.
  • [3]: среднее значение, медиана и способ унимодального распределения: характеристика. С. Басу и А. ДасГупта (1997). Теория вероятност. Appl., 41 (2), 210–223.
  • [4]: некоторые замечания о среднем, среднем, моде и асимметрии. Мичикадзу Сато. Австралийский журнал статистики. Том 39, выпуск 2, стр. 219–224, июнь 1997 г.
  • [5]: PT von Hippel (2005). Среднее значение, медиана и перекос: исправление правила из учебника. Журнал статистики образования том 13, номер 2.

Извините, я всего лишь студент первого курса математики. Не могли бы вы предоставить / порекомендовать ссылку / книгу / документ, который описывает, как были получены отношения?
Сара

3
@ Сара Я думаю, что это восходит к Карлу Пирсону, который использует это эмпирическое отношение для его "асимметрии режима Пирсона". Помимо этого, вы можете найти интересную эту онлайн-статью, j.mp/aWymCv .
ЧЛ

Спасибо chl и kwak за предоставленную ссылку и ответ. Я буду изучать их.
Сара

2
Различные точки:сведено к минимуму , когда является медианой . В статье фон Хиппеля (ссылка на которую приведена выше в разделе chl) обсуждаются исключения, а btinternet.com/~se16/hgb/median.htm показывает возможную связь между средним значением, медианой, модой и стандартным отклонением как для непрерывного, так и для дискретного распределения. Фактически 3 может принимать любое значение: положительное, отрицательное, ноль или бесконечное. E|Xk|kX
Генри

1
Может быть, я немного дремучий (это будет не в первый раз). Можете ли вы уточнить, какследует из (1) и (3)? |Mμ|3|μm|
Glen_b

9

В статье, на которую указывает chl, дается некоторая важная информация, показывающая, что она не близка к общему правилу (даже для непрерывных, гладких, «хорошо управляемых» переменных, таких как Вейбулл). Так что, хотя это часто может быть примерно правдой, часто это не так.

Так откуда же Пирсон? Как он пришел к этому приближению?

К счастью, Пирсон в значительной степени говорит нам ответ сам.

Первое использование термина «перекос» в том смысле, в котором мы его используем, кажется, Пирсон, 1895 г. [1] (он появляется прямо в заголовке). Похоже, что в этой статье он вводит термин « мода» (сноска, стр.345):

Я нашел удобным использовать термин « мода» для абсциссы, соответствующей ординате максимальной частоты. «Среднее», «мода» и «медиана» имеют все различные символы, важные для статистики.

Это также, кажется, его первая реальная детализация его системы частотных кривых .

Поэтому, обсуждая оценку параметра формы в распределении Пирсона Типа III (то, что мы сейчас назвали бы смещенной - и, возможно, перевернутой - гаммой), он говорит (p375):

Среднее значение, медиана и мода или максимальная ордината отмечены bb , cc и aa , соответственно, и как только кривые были нарисованы, между позициями трех величин проявилось замечательное соотношение: медиана, так что до тех пор, пока был положительным * было видно, что составляет около одной трети от среднего значения к максимуму p

* это соответствует гамме, имеющей параметр формы >1

здесь намерение «максимум» - это значение x максимальной частоты (моды), как видно из начала кавычки, а не максимума случайной величины.x

И действительно, если мы посмотрим на отношение (среднее значение) к (среднее значение) для гамма-распределения, мы увидим следующее:

enter image description here

(Синяя часть обозначает область, которую Пирсон говорит, что приближение является разумным).

αβ

enter image description here

βα=kβααβααββ+α=cβ+ααβ

α>10

enter image description here

eμσ2,eμeμ+σ2/2

eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

Существует довольно много хорошо известных распределений, некоторые из которых были знакомы Пирсону, для которых оно близко к истинному для широкого диапазона значений параметров; он заметил это с гамма-распределением, но эту идею подтвердили бы, когда он пришел посмотреть на несколько других распределений, которые он мог бы рассмотреть.

[1]: Пирсон, К. (1895),
«Вклад в математическую теорию эволюции, II: Косая вариация в однородном материале», «
Философские труды Королевского общества», серия А, 186, 343-414
[Из авторского права. Свободно доступен здесь ]


4

Это отношение не было выведено. Было замечено, что эмпирически приближенно держатся на почти симметричных распределениях . См. Описание Йоля в «Введение в теорию статистики» (1922), с.121, глава VII, раздел 20. Он представляет эмпирический пример.


+1 Действительно, моя цитата из Пирсона 1895 года указывает на то, что он что-то заметил, а не получил.
Glen_b

2
Старые математические тексты читать гораздо веселее, чем сегодняшние
Аксакал
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.