Когда мы будем использовать танилы и медиальные, а не квантили и медианные?


14

Я не могу найти определения для tantile или medial в Википедии или Wolfram Mathworld, но следующее объяснение дано в Bílková, D. and Mala, I. (2012), " Применение метода L-момента при моделировании распределения дохода в Чешской Республике ", Австрийский журнал статистики , 41 (2), 125–132.

Медиана - это значение (выборка) тантиля, так же как медиана выборки равна значению квантиля 50 % выборки. Образцы как текстильных, так и квантильных образцов основаны на упорядоченном образце. Прежде всего оцениваются кумулятивные суммы наблюдений в упорядоченной выборке. Затем для данного процента , , тантиль определяется как значение анализируемой переменной, которая делит все наблюдения в упорядоченной выборке на две части: сумма меньших или равных наблюдений равна p %. от общей суммы наблюдений, а сумма наблюдений, которая больше, представляет остаток ( 100 -50%50%p0<p<100p%p% от этой суммы.(100p)%

Когда имеет смысл использовать их как меры местоположения, а не как более традиционные медианы или другие квантили? Одна возможная ситуация, доходы домохозяйств, приведена в этом документе:

Из этого определения можно сделать вывод, что медиальная величина может использоваться в качестве разумной характеристики уровня дохода, поскольку домохозяйства с доходом, меньшим или равным медиальному, получают половину общего дохода в выборке, а домохозяйства с более высоким доходом. чем медиальное получение другой половины.

В этом случае средний доход домохозяйства составил 117 497 чешских крон (т.е. половина домохозяйств заработала больше, чем эта, а половина заработала выше) по сравнению со средним доходом домохозяйства в 133 930 чешских крон (домохозяйства с доходом выше этого показателя получают половину дохода). суммарный доход). Обратите внимание, что это сравнение не обязательно отражает асимметрию доходов домохозяйства или даже его неравномерность: даже если бы доходы домохозяйства были распределены равномерно, медиальное значение все равно было бы выше среднего. Насколько я понимаю определение, медиальная сумма была бы равна медиане, только если все домохозяйства получали одинаковый доход.

Так есть ли какая-то конкретная причина, чтобы отдать предпочтение медиальному в этом случае или хотя бы использовать его в качестве дополнительной меры? Что именно говорит нам сравнение между медианой и медиалой? Не похоже, что медиальное значение напрямую сопоставимо с другими показателями центральной тенденции по причинам, которые я только что отметил. Существуют ли какие-либо другие ситуации, когда медиальные / дубильные изделия широко используются или считаются особенно информативными? Практические примеры их использования с примерами исследовательских работ были бы очень полезны, а интуитивная идея более широкого контекста, в котором они могут оказаться полезными, была бы еще лучше.

Требуется, чтобы итоговые и промежуточные итоги были значимыми - что-то, что имеет отношение к деньгам, и то, как распределяется «пирог», - но даже акт сложения имеет смысл только для определенных количеств. Для интенсивных, а не экстенсивных свойств , таких как плотность или температура, любое суммирование не будет физически значимым. Мне кажется, что обширная собственность необходима, но не достаточна для того, чтобы полезные вещества были полезны, поскольку я могу представить, что аналитик по перевозкам интересуется, какой вес перевозимого груза является отсеченным, так что 50% всего груза (по весу) составляет перевозить грузы с таким весом или выше, но я не могу представить себе эколога, заинтересованного в том, какая длина тритона такова, чтобы 50% от общей длины всех тритонов составляли тритоны этой длины или более.


3
@ NickCox Насколько я понимаю, медиана дает пороговое значение, в котором, грубо говоря (я полностью игнорирую проблему связей), половина домохозяйств получает больше, чем порог, а половина домохозяйств получает меньше этого. Медиана дает другое пороговое значение, так что общий доход домохозяйств, получающих больше, чем порог, составляет 50% от всего дохода, в то время как общий доход домохозяйств, получающих меньше, чем пороговое значение, составляет 50% от всего дохода.
Серебряная

2
Шляпа: мне стало любопытно от этого после комментария @ttnphns по моему предыдущему вопросу ; Средние (арифметические, геометрические, гармонические, механические, экспоненциальные, комбинаторные и т. д.) являются «средними аналитическими». Медиана, квантили, сантилии - это «средние значения по положению».
Серебряная

4
Благодарность; Я неправильно понял это и ценю исправление. Я перефразировал бы от «суммы наблюдений» к «сумме значений», поскольку «сумма наблюдений» слишком близка к «количеству наблюдений» для меня. Или, возможно, я ищу оправдание ... Должна быть связь с кривыми Лоренца. Мера кажется полезной, только если рассматриваемая переменная является условно аддитивной или обширной. Сэр Дэвид Кокс часто подчеркивает важность того, являются ли переменные обширными. Таким образом, имеет смысл рассмотреть общий доход, общее количество осадков, но не общий доход от бревна или общую температуру.
Ник Кокс

2
@NickCox Я думаю, что экстенсиональность - превосходный момент (и, по моему мнению, предложенная вами переформулировка тоже была бы улучшением), хотя мне кажется, что обширное свойство необходимо, но недостаточно для того, чтобы полезные текстильные материалы были полезны. Кажется вероятным, что нас может заинтересовать, например, какой вес перевозимого груза является пороговым, так что 50% всего груза (по весу) перевозится в грузах такого веса или выше; но я не могу представить, что меня интересует, какая длина тритона такова, что 50% общей длины всех тритонов приходится на тритоны этой длины или более.
Серебряная

1
Я согласен на практике, но я не думаю, что принцип затронут. Ответом «Но это не было бы интересно или полезно» не всегда должно быть какое-то отображение математического или статистического принципа; также есть возможность для «Не делай этого!».
Ник Кокс

Ответы:


3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

Правильно ли это толкование? Это то, что было задумано?

Чтобы вернуться к первоначальному вопросу, в контексте распределения доходов, tantile - это величина дохода, при которой половина общего дохода приходится на людей с доходом выше этого, а половина общего дохода - на людей с доходом ниже этого.

EDIT

G(t)

G(t)t

Другой термин, используемый для этой идеи - «частичное ожидание». Смотрите, например, /math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distributed-r и используйте Google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
Спасибо за добавление - мне придется кое-что почитать, судя по всему!
Серебряная рыбка
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.