Является ли медиана типом среднего для некоторого обобщения «среднего»?


20

Понятие «среднее» бродит гораздо шире, чем традиционное среднее арифметическое; это простирается так далеко, чтобы включить медиану? По аналогии

необработанные данныеЯ бынеобработанные данныежадныйсырое среднееЯ бы-1среднее арифметическоенеобработанные данныеRecipобратныежадныйзначит взаимныйRecip-1среднее гармоническоенеобработанные данныежурналбревнажадныйсредний журналжурнал-1среднее геометрическоенеобработанные данныеплощадьквадратыжадныйсредняя площадьплощадь-1среднеквадратичное значениенеобработанные данныерангрядыжадныйсредний рангранг-1медиана

Я провожу аналогию со средним квазиарифметическим выражением, определяемым как:

Mе(Икс1,...,ИксN)знак равное-1(1NΣязнак равно1Nе(Икся))

Для сравнения, когда мы говорим, что медиана набора данных из пяти элементов равна третьему элементу, мы можем видеть, что это эквивалентно ранжированию данных от одного до пяти (что мы можем обозначить функцией ); брать среднее значение преобразованных данных (а это три); и считывание значения элемента данных, который имел ранг три (разновидность f ^ {- 1} ).ее-1

В примерах среднего геометрического, среднего гармонического и среднеквадратичного значения е представляла собой фиксированную функцию, которую можно применять к любому числу в отдельности. Напротив, либо для присвоения ранга, либо для возврата из рангов к исходным данным (интерполяция там, где это необходимо) требуется знание всего набора данных. Более того, в определениях, которые я прочитал о квазиарифметическом среднем, е должно быть непрерывным. Рассматривается ли медиана как частный случай квазиарифметического среднего, и если да, то как определяется е ? Или медиана когда-либо описывалась как пример какого-то другого более широкого понятия «среднее»? Квазиарифметическое среднее, конечно, не единственное доступное обобщение.

Часть вопроса является терминологической (что означает «означает» в любом случае, особенно в отличие от «центральной тенденции» или «среднего»?). Например, в литературе по нечетким системам управления функция агрегирования F:[a,б]×[a,б][a,б] является возрастающей функцией с F(a,a)знак равноa и F(б,б)знак равноб ; функция агрегации, для которой мин(Икс,Y)F(Икс,Y)Максимум(Икс,Y) для всех Икс,Y[a,б] называется «средним» (в общий смысл). Излишне говорить, что такое определение невероятно широкое! И в этом контексте медиана действительно упоминается как тип среднего. [1]Но мне любопытно, могут ли менее широкие характеристики среднего значения все еще простираться достаточно далеко, чтобы охватить медиану - так называемое обобщенное среднее (которое лучше было бы описать как «среднее значение силы»), а среднее Лемера - нет, но другие могут , Для чего это стоит, Википедия включает «медиану» в свой список «других средств» , но без дальнейших комментариев или цитирования.

[1] : Такое широкое определение среднего значения, подходящее для более чем двух входов, кажется стандартным в области нечеткого контроля и многократно возникало при поиске в Интернете случаев, когда медиана описывается как медиана; Я приведу, например, Fodor, JC & Rudas, IJ (2009), « О некоторых классах функций агрегации, которые являются миграционными », IFSA / EUSFLAT Conf. (стр. 653-656). Кстати, в этой статье отмечается, что одним из самых ранних пользователей термина «среднее» ( moyenne ) был Коши , в Политехническом курсе королевской школы, 1ère partie; Проанализируйте альбрике (1821). Более поздние вклады Aczél , Chisini ,и де Финетти в разработке более общих понятий «среднее», чем Коши, признано в Fodor, J. и Roubens, M. (1995), « О значимости средств », Журнал вычислительной и прикладной математики , 64 (1), 103-115.


Я думаю, что среднее арифметическое, среднее и среднее руды часто называют в целом «средним», и это слово иногда используется неоднозначно. Книга « Как лгать со статистикой» использует ее как пример «лжи» со статистикой. (Я понимаю, что ваш вопрос носит более общий характер, поэтому опубликуйте его как комментарий.)
Тим

@ Тим У меня есть ненаучное впечатление, что редко можно увидеть «моду», называемую «средним». Но, безусловно, существует огромная путаница в отношении использования «среднего» (которое иногда используется как синоним «среднего арифметического», а в другое время используются показатели центральной тенденции, которые вовсе не являются средними) и «среднего» (которое в общее использование, а не в техническом смысле, в основном, но не исключительно, используется для «среднего арифметического»). Между прочим, это также сложная тема для поиска в интернете, из-за других значений «значит»!
Серебряная

3
средства (арифметические, геометрические, гармонические, механические, экспоненциальные, комбинаторные и т. д.) являются «средними аналитическими». Медиана, квантили, сантилии - это «средние значения по положению». Ранжирование весьма отличается от log, square и т. Д., Поскольку оно представляет собой монотонное преобразование любого изменения в однородное изменение и обратного пути к преобразованию не существует.
ttnphns

Кстати, термин «обобщенное среднее» озабочен en.wikipedia.org/wiki/Generalized_mean
ttnphns

3
Если вы разрешите веса в расчете , то медиана легко может рассматриваться как своего рода среднее. Точно так же, но не идентично, понятие обрезанных средств, безусловно, включает медианы как ограничивающий или вежливый частный случай. stata-journal.com/article.html?article=st0313 - это один из сравнительно недавних обзоров. ΣявесяИкся,Σявесязнак равно1
Ник Кокс

Ответы:


9

Вот один из способов, которым вы можете рассматривать медиану как «общий вид среднего значения» - во-первых, тщательно определите свое обычное среднее арифметическое в терминах статистики порядка:

x¯=iwix(i),wi=1n.

Затем, заменив это обычное среднее значение статистики заказов какой-либо другой весовой функцией, мы получим понятие «обобщенное среднее», которое учитывает порядок.

В этом случае множество потенциальных мер центра превращается в «обобщенные виды средств». В случае медианы, для нечетного , , а все остальные равны 0, а для четного , .n w nnw(n+1)/2=1nwn2=wn2+1=12

Точно так же, если мы посмотрим на M-оценку , оценки местоположения могут также рассматриваться как обобщение среднего арифметического (где для среднего значения является квадратичным, является линейным или весовая функция является плоской), и Медиана также попадает в этот класс обобщений. Это несколько иное обобщение, чем предыдущее.ψρψ

Существует множество других способов, которыми мы могли бы расширить понятие «среднее», которое может включать медиану.


Это очень мило. Тесно связан с этим ответом, и который обсуждается в статьях, цитируемых в вопросе: упорядоченное средневзвешенное значение или OWA
Silverfish

11

Если вы рассматриваете среднее значение как точку, минимизирующую квадратичную функцию потерь SSE, то медиана - это точка, минимизирующая линейную функцию потерь MAD, а режим - это точка, минимизирующая некоторую функцию потерь 0-1. Никаких преобразований не требуется.

Таким образом, медиана является примером среднего значения по Фреше .


3
@Mike Anderson: Ну, это показывает, что СМИ - это среднее по Фреше (см. Статью в Википедии): en.wikipedia.org/wiki/Fr%C3%A9chet_mean
kjetil b halvorsen

@ Kjetil Отлично! Тот факт, что медиана является примером среднего значения Фреше, является точным ответом на мой вопрос: «Медиана когда-либо описывалась как пример какого-то другого более широкого понятия« среднее »?» И +1 к Майку Андерсону. Надеюсь эта информация отредактирована в ответе.
Серебряная

2
Я добавил комментарий @ Kjetil к ответу, чтобы он отображался в поиске по сайту "Frechet mean". Спасибо вам обоим.
Серебряная рыба

4

Один простой , но плодотворным обобщение для взвешенных средних , где Σ п я = 1 ш я = 1 . Ясно, что общее или садовое среднее является простейшим частным случаем с равными весами w i = 1 / n .i=1nwixi/i=1nwi,i=1nwi=1весязнак равно1/N

Разрешение весов зависит от порядка значений по величине, от наименьшего до наибольшего, указывает на различные другие особые случаи, в частности на идею усеченного среднего , которая известна и под другими именами.

Чтобы избежать чрезмерного использования обозначений там, где они не нужны или особенно полезны, представьте, например, игнорирование наименьших и наибольших значений и взятие (одинаково взвешенного) среднего значения других. Или представьте, что вы игнорируете два наименьших и два наибольших значения и берете среднее от других; и так далее. Наиболее энергичное усечение будет игнорировать все, кроме одного или двух средних значений по порядку, в зависимости от того, было ли число значений нечетным или четным, что, естественно, является просто знакомой медианой . Ничто в идее обрезки не обязывает вас игнорировать равные числа в каждом хвосте сэмпла, но если говорить больше об асимметричной обрезке, это уведет нас дальше от основной идеи в этой теме.

Короче говоря, средние (неквалифицированные) и медианы являются крайними предельными случаями семейства (симметричных) усеченных средних. Общая идея заключается в том, чтобы обеспечить компромисс между одним идеалом использования всей информации в данных и другим идеалом защиты от экстремальных точек данных, которые могут быть ненадежными выбросами.

Смотрите ссылку здесь для одного довольно недавнего обзора.


4

Этот вопрос предлагает нам охарактеризовать понятие «среднее» в достаточно широком смысле, чтобы охватить все обычные средства - средние значения, означает, медианы, усеченные средства - но не настолько широко, что оно становится практически бесполезным для анализа данных. , В этом ответе обсуждаются некоторые аксиоматические свойства, которыми должно обладать любое достаточно полезное определение «среднего».Lп


Основные Аксиомы

Полезно широкое определение «среднего» для анализа данных будет представлять собой любую последовательность четко определенных детерминированных функций для A R и n = 1 , 2 , таких, чтоеN:ANAAрNзнак равно1,2,...

(1) для всех (среднее значение лежит между крайностями),x = ( x 1 , x 2 , , x n ) A nмин(Икс)еN(Икс)Максимум(Икс)Иксзнак равно(Икс1,Икс2,...,ИксN)AN

(2) инвариантен относительно перестановок своих аргументов (значит, не заботится о порядке данных), иеN

(3) каждый не уменьшается в каждом из своих аргументов (при увеличении чисел их среднее значение не может уменьшаться).еN

Мы должны допустить, чтобы было правильным подмножеством действительных чисел (таких как все положительные числа), потому что множество средств, таких как геометрические средние, определены только на таких подмножествах.A

Мы могли бы также добавить, что

(1 ') существует, по крайней мере, некоторый для которого (средства не являются крайностями). (Мы не можем требовать, чтобы это всегда выполнялось. Например, медиана равна , что является минимумом.)min ( x ) f n ( x ) max ( x ) ( 0 , 0 , , 0 , 1 ) 0ИксAмин(Икс)еN(Икс)Максимум(Икс)(0,0,...,0,1)0

Эти свойства, кажется, отражают идею «среднего», являющегося неким «средним значением» набора (неупорядоченных) данных.

Аксиомы согласованности

Кроме того, у меня возникает соблазн сформулировать довольно менее очевидный критерий согласованности

(4.a) Диапазон значений при изменении во всем интервале включает в себя . Другими словами, всегда можно оставить среднее значение без изменений, добавив соответствующее значение к набору данных. В сочетании с (3) это означает, что присоединение экстремальных значений к набору данных будет тянуть среднее значение к этим экстремальным значениям.t [ мин ( x ) , max ( x ) ] f n ( x ) tеN+1(T,Икс1,Икс2,...,ИксN)T[мин(Икс),Максимум(Икс)]еN(Икс)T

Если мы хотим применить понятие среднего к распределению или «бесконечной населенности», то одним из способов было бы получить его в пределе произвольно больших случайных выборок. Конечно, предел может не всегда существовать (он не существует для среднего арифметического, например, когда распределение не имеет ожидания). Поэтому я не хочу навязывать какие-либо дополнительные аксиомы, чтобы гарантировать существование таких ограничений, но следующее кажется естественным и полезным:

(4.b) Если ограничен и является последовательностью выборок из распределения поддерживаемого на , то предел почти наверняка существует. Это препятствует тому, чтобы среднее значение всегда "подпрыгивало" в пределах даже когда размеры выборки становятся все больше и больше.x n F A f n ( x n ) AAИксNFAеN(ИксN)A

В том же духе мы могли бы еще больше сузить идею средства, чтобы настаивать на том, чтобы оно стало более точной оценкой «местоположения» при увеличении размеров выборки:

(4.c) Всякий раз, когда ограничен, дисперсия распределения выборки для случайной выборки из не убывает по .f n ( X ( n ) ) X ( n ) = ( X 1 , X 2 , , X n ) F nAеN(Икс(N))Икс(N)знак равно(Икс1,Икс2,...,ИксN)FN

Аксиома непрерывности

Мы могли бы подумать о том, чтобы попросить средства «красиво» меняться с данными:

(5) отдельно непрерывен в каждом аргументе (небольшое изменение значений данных не должно вызывать внезапного скачка их среднего значения).еN

Это требование может устранить некоторые странные обобщения, но оно не исключает какого-либо общеизвестного среднего значения. Это исключит некоторые функции агрегирования.

Аксиома инвариантности

Мы можем представить себе средства как применяемые к данным интервалов или отношений (в известном смысле Стивенса). Мы не можем требовать, чтобы они были инвариантными при сдвигах местоположения (среднее геометрическое нет), но мы можем требовать

(6) для всех и всех для которых . Это говорит только о том, что мы можем свободно вычислять используя любые единицы измерения, которые нам нравятся.xA n λ > 0 λ xA n f nеN(λИкс)знак равноλеN(Икс)ИксANλ>0λИксANеN

Все средства, упомянутые в вопросе, удовлетворяют этой аксиоме, за исключением некоторых функций агрегирования.


обсуждение

е2N>2

Обычная медиана образца обладает всеми этими аксиоматическими свойствами.

Мы могли бы расширить аксиомы согласованности, чтобы включить

е2N(Икс;Икс)знак равноеN(Икс)ИксAN,

100α% 100α%(1,2,3,6)(2,2,3,3)2.5(1,1,2,2,3,3,6,6)3,5

Я не знаю, какая из аксиом согласованности (4.a), (4.b) или (4.c) была бы наиболее желательной или полезной. Они кажутся независимыми: я не думаю, что любые два из них подразумевают третий.


(+1) Я думаю, (1 '), «значит, не крайности», это интересный момент. Многие иначе естественные определения среднего случаться включать минимум и максимум в качестве специальных или предельных случаев: это верно энергетических средств , Лехмер средств , Фреш среднего , Кизиньте среднее и Stolarsky среднего . Хотя кажется странным называть их «средними»!
Серебряная

Да, предельные случаи неизбежны. Но для конечных наборов данных мы можем настаивать на том, чтобы ни максимум, ни минимум не квалифицировались как «средства».
whuber

С другой стороны, верно не только то, что «обычная выборочная медиана обладает всеми этими аксиоматическими свойствами», но и обычный квантиль выборки (если я что-то не пропустил). Также немного странно ссылаться, например, на верхний квартиль как на «среднее» (хотя я видел, что он используется в качестве меры центральной тенденции для очень искаженных данных). Если мы примем все другие квантили, то больше не будем чувствовать себя настолько извращенными, чтобы допускать минимумы и максимумы. Но я, конечно, вижу, что может быть желательно хотя бы сохранить за собой право исключать их.
Серебряная

1
Я не обеспокоен допуском квантилей в пантеон средств. В конце концов, для заданных семейств распределений некоторые немедианские квантили будут совпадать с арифметическими, поэтому у вас могут возникнуть проблемы, если вы попытаетесь исключить эту возможность аксиоматически. (Например, рассмотрим семейство логнормальных распределений постоянной геометрической SD.) Если среднее арифметическое не может быть квалифицировано как среднее, все потеряно!
whuber

1
N>2

2

Я думаю, что медиана может рассматриваться как тип обобщения среднего арифметического. В частности, среднее арифметическое и медиана (среди прочих) могут быть объединены как частные случаи среднего Кизини, Если вы собираетесь выполнить какую-то операцию над набором значений, среднее число Кизини - это число, которое вы можете заменить на все исходные значения в наборе и все же получить тот же результат. Например, если вы хотите суммировать свои значения, замена всех значений на среднее арифметическое даст ту же сумму. Идея состоит в том, что определенное значение представляет числа в наборе в контексте определенной операции над этими числами. (Интересный смысл этого способа мышления состоит в том, что данное значение - среднее арифметическое - можно считать представительным только в предположении, что вы делаете определенные вещи с этими числами.)

Это менее очевидно для медианы (и я отмечаю, что медиана не указана в качестве одного из средств Кизини в Вольфраме или Википедии ), но если вы разрешите операции над рангами, медиана может вписаться в ту же идею.


Mе(M,M,,,,,M)знак равное(Икс1,Икс2,,,,,ИксN)

Это хороший вопрос, @Silverfish, я думал об этом ;-). Я думаю больше о том, что в вашем вопросе и обсуждении в комментариях концептуальная основа, кажется, заключается в том, как получить среднее значение и как вернуть данные из среднего; OTOH, мое обрамление - это то, для чего мы используем среднее: то есть как сжатое представление данных с минимальной потерей информации.
gung - Восстановить Монику

е

@ Silverfish, я допускаю, что это кажется довольно проблемной дырой в моей позиции.
gung - Восстановить Монику

(Икс¯,Икс¯,,,,,Икс¯)Икс¯

-1

Вопрос не очень хорошо определен. Если мы согласимся с общим «уличным» определением среднего значения как суммы n чисел, деленных на n, мы получим долю в земле. Далее. Если мы посмотрим на показатели центральной тенденции, мы можем сказать, что и Среднее, и Медиана - это генерация, но не друг друга. Часть моего опыта связана с непараметрическими параметрами, поэтому мне нравятся медиана и надежность, которую он обеспечивает, неизменность монотонной трансформации и многое другое. но каждая мера имеет свое место в зависимости от цели.


2
Добро пожаловать на наш сайт, Боб. Я считаю, что если вы прочитаете до конца вопрос - особенно длинный предпоследний абзац - вы обнаружите, что он точный и четко определенный. (Если нет, то было бы неплохо объяснить, что вы имеете в виду под «
нечетко

1
Я на самом деле сочувствую ощущению Боба, что вопрос не очень четко определен, в том смысле, что у понятия «среднее» нет единого определения, но я старался изо всех сил, чтобы все было как можно яснее. Я надеюсь, что мое последнее изменение поможет прояснить ситуацию.
Серебряная

1
Причина, по которой я чувствую, что вопрос имеет какую-то ценность, кроме простой терминологии (что означает в любом случае, и есть ли определение, которое мы можем растянуть настолько, чтобы включить медиану?) В том, что может быть поучительно видеть медиану как единое целое член семьи обобщений среднего; Пример Ник Кокса о медиане как предельном случае усеченного среднего особенно хорош - он аккуратно связан с тем свойством «робастности», которое вам нравится. В семействе усеченных средних среднее арифметическое «улицы» и медиана лежат на противоположных концах со спектром между ними.
Серебряная
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.