Почему все известные дистрибутивы унимодальны?


13

Я не знаю ни одного мультимодального дистрибутива.

Почему все известные дистрибутивы унимодальны? Есть ли какой-нибудь "знаменитый" дистрибутив с более чем одним режимом?

Конечно, смеси распределений часто являются мультимодальными, но я хотел бы знать, существуют ли какие-либо «несмешанные» распределения, которые имеют более одной моды.


5
Вы говорите о «стандартных» дистрибутивах, а не о «известных» дистрибутивах
Стефан Лоран,

12
Как насчет бета с ? α=β=0.5
говорит амеба: восстанови Монику

1
Если вы не возражаете против ограниченных бимодальных распределений , Википедия также упоминает U-квадратичное и арксинусное распределение . Я думаю, что это всего лишь особые случаи бета-распределения ... В Википедии также упоминаются некоторые примеры естественного появления мультимодальных распределений .
Ник Стаунер

12
@ StéphaneLaurent: Мне нравятся «дистрибутивы фирменных знаков» , поскольку передача названного имени сама по себе не подразумевает какого-либо особого статуса для дистрибуции. «Известные» дистрибутивы создают впечатление, что остальные могут быть где-то там, ожидая своего открытия, например, монстр Лох-Несс или темная материя.
Scortchi - Восстановить Монику

5
Отлично @ Scortchi, отличный словарный запас! У многих ученых-нематематиков, с которыми я столкнулся, сложилось впечатление, что дистрибуция без названия не существует. Возможно, есть связанный с этим более глубокий философский факт, путаница имени и того, что обозначается этим именем (как сказал Рассел: «Слово« собака »не имеет никакого сходства с собакой»)
Стефан Лоран,

Ответы:


17

Ответы на первую часть вопроса даны в комментариях к вопросу: множество дистрибутивов «фирменных» являются мультимодальными, например, любой дистрибутив Beta с a < 1 и b < 1 . Давайте теперь обратимся ко второй части вопроса.(a,b)a<1b<1

Все дискретные распределения представляют собой явно смеси (атомов, которые унимодальны).

Я покажу, что большинство непрерывных распределений также представляют собой смеси унимодальных распределений. Интуиция за этим проста: мы можем «отшлифовать» неровности на ухабистом графике PDF, один за другим, пока график не станет горизонтальным. Удары становятся компонентами смеси, каждый из которых явно унимодален.

Следовательно, за исключением, возможно, некоторых необычных распределений, чьи PDF-файлы являются очень прерывистыми, ответ на вопрос «нет»: все мультимодальные распределения, которые являются абсолютно непрерывными, дискретными или комбинацией этих двух, представляют собой смеси унимодальных распределений.


Рассмотрим непрерывные распределения , PDF-файлы которых f непрерывны (это «абсолютно непрерывные» распределения). (Непрерывность не является ограничением; ее можно еще больше ослабить с помощью более тщательного анализа, предполагая лишь, что точки разрыва дискретны.) Ff

Чтобы справиться с «плато» постоянных значений, которые могут возникнуть, определите «режим» как интервал (который может быть одной точкой, где x l = x u ), такой, чтоm=[xl,xu]xl=xu

  1. имеет постоянное значение на m , скажем, y .fm,y

  2. не является постоянным на любом интервале, который строго содержит m .fm

  3. Существует такое положительное число , что максимальное значение f, достигаемое на [ x l - ϵ , x u + ϵ ], равно y .ϵf[xlϵ,xu+ϵ]y

Пусть - любая мода f . Поскольку f непрерывна, существуют интервалы [ x l , x u ], содержащие m, для которых f не уменьшается в [ x l , x l ] (что является правильным интервалом, а не просто точкой) и не увеличивается в [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](что также является правильным интервалом). Пусть - бесконечный минимум всех таких значений, а x u - супремум всех таких значений.xlxu

Эта конструкция определила один «горб» на графике , проходящие от Купить ' л до й ' ц . Пусть y будет больше из f ( x l ) и f ( x u ) . По построению множество точек x в [ x l , x u ], для которых f ( x ) y, является собственным интервалом m fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymстрого содержащий (потому что он содержит либо целое из [ x l , x l ], либо [ x u , x u ] ).m[xl,xl][xu,xu]

Figure

На этой иллюстрации мультимодального PDF режим обозначен красной точкой на горизонтальной оси. Горизонтальная протяженность красной части заливки - это интервал m : это основание горба, определяемого модой m . Основание этого горба находится на высоте y 0,16 . Оригинальный PDF - это сумма красной и синей заливок. Обратите внимание, что у синей заливки только один режим около 2 ; оригинальный режим в [ 0 , 0 ] был удален.m=[0,0]mmy0.162[0,0]

Написание для длины m определите|m|m

pm=PrF(m)y|m|

и

fm(x)=f(x)ypm

когда и е м ( х ) = 0 в противном случае. (Это делает f m непрерывной функцией, между прочим.) Числитель - это величина, на которую f поднимается выше y, а знаменатель p m - это площадь между графиком f и y . Таким образом, f m неотрицательна и имеет общую площадь 1 : это PDF распределения вероятностей. По построению он имеет уникальный режим m .xmfm(x)=0fmfypmfyfm1m

Также по конструкции, функция

fm(x)=f(x)pmfm(x)1pm

это PDF при условии . (Очевидно, что если p m = 1, то от f ничего не останется , что должно было быть унимодальным для начала.) Более того, у него нет мод в интервале m (где он постоянен, поэтому предыдущее тщательное определение a Режим как интервал был необходим). Более того,pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

является смесью унимодального PDF и PDF f m .fmfm

Повторите эту процедуру с (которая как линейная комбинация непрерывных функций все еще является непрерывной функцией, позволяющей нам действовать как и прежде), создавая последовательность режимов m = m 1 , m 2 , ; соответствующие последовательности весов p 1 = p m , p 2 = p m 2 , ; и PDF-файлы f 1 = f m , f 2 = f m 2 , .fmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,. Ограничивающий результат существует потому, что (а) интервал, в котором сглаживается, включает в себя надлежащий интервал, который не был сглажен в предыдущих операциях i - 1, и (b) действительные числа не могут быть разложены более чем на счетное число таких интервалов , Предел не может иметь никаких мод и поэтому является постоянным, который должен быть нулевым (иначе его интеграл расходился бы). Следовательно, f было выражено (возможно, не однозначно, потому что порядок, в котором были выбраны моды, будет иметь значение) как смесьfii1f

f(x)=ipifi(x)

унимодальных распределений, QED.


7

Под унимодалом я думаю, что OP явно означает, что существует только один внутренний режим (т.е. исключая угловые решения). Таким образом, вопрос действительно задает ...

why is it that brand name distributions do NOT have more than one interior mode?

то есть почему большинство дистрибутивов брендов выглядят примерно так:

enter image description here

... плюс или минус некоторая асимметрия или некоторые разрывы? Когда вопрос ставится таким образом, бета-распределение не будет действительным контрпримером.

Похоже, гипотеза ФП имеет определенную силу: большинство распространенных брендов не допускают использования более одного внутреннего режима. Там могут быть теоретические причины для этого. Например, любой дистрибутив, являющийся членом семейства Пирсонов (который включает в себя бета-версию), обязательно будет (внутренним) унимодальным, как следствие родительского дифференциального уравнения, определяющего всю семью. И семья Пирсонов гнездится в большинстве известных брендов.

Тем не менее, вот несколько примеров встреч с торговыми марками ...

Контрпример

Одним из контрпримеров фирменного дистрибутив Sinc 2 с pdf:Sinc2

f(x)=sin2(x)πx2

Sinc2

enter image description here

Возможно, мы могли бы также добавить семейство cardiod и дистрибутивов, связанных с этим классом ... с pdf-графиками, такими как:

enter image description here

Семейство отраженных брендовых дистрибутивов также может быть возможным претендентом на имя бренда (хотя их можно рассматривать как «обманное решение» ... но они все еще являются торговыми марками), например, «Отраженный Вейбулл», показанный здесь:

enter image description here


1
Sinc2

1
Привет @whuber ... должен согласиться с артефактом заговора (я расскажу об этом на Mathematica SE!). Re cardiod family: идея в том, что можно расширять область таких семейств как угодно, и, как синусоида, она продолжает давать :)
wolfies

1
Sinc2

Я думаю, что это только потому, что нанесенная линия толще линии оси, поэтому кажется, что она «пересекает» ось, когда она близка к нулю. Если линия строится тоньше, артефакт исчезает.
волки

Но на вашей нижней фигуре нет такого артефакта, у которого также есть линии, более толстые, чем ось.
whuber

3

То, что вы не можете думать ни о чем, не означает, что их нет.

Я могу назвать «известные» дистрибутивы, которые не являются унимодальными.

Например, бета-версия с α и β и то и другое <1,

http://en.wikipedia.org/wiki/Beta_distribution

также см

http://en.wikipedia.org/wiki/U-quadratic_distribution

(Это не особый случай бета-распределения, несмотря на комментарий, в котором говорится, что это так. Однако у двух семейств есть некоторые совпадения.)

Распределения смесей, безусловно, известны, и многие из них являются мультимодальными.


U-квадратичный является усеченным бета-распределением.
becko

1

Альфа-косо-нормальное распределение (Elal-Olivero 2010) имеет PDF:

(1-αИкс-μσ)2+12+α2φ(Икс-μσ),

где φ PDF стандартного гауссова

За |α|>1,34распределение бимодальное. Примерный сюжет дляμзнак равно1,σзнак равно0,5,aзнак равно2:

enter image description here

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.