Ответы на первую часть вопроса даны в комментариях к вопросу: множество дистрибутивов «фирменных» являются мультимодальными, например, любой дистрибутив Beta с a < 1 и b < 1 . Давайте теперь обратимся ко второй части вопроса.(a,b)a<1b<1
Все дискретные распределения представляют собой явно смеси (атомов, которые унимодальны).
Я покажу, что большинство непрерывных распределений также представляют собой смеси унимодальных распределений. Интуиция за этим проста: мы можем «отшлифовать» неровности на ухабистом графике PDF, один за другим, пока график не станет горизонтальным. Удары становятся компонентами смеси, каждый из которых явно унимодален.
Следовательно, за исключением, возможно, некоторых необычных распределений, чьи PDF-файлы являются очень прерывистыми, ответ на вопрос «нет»: все мультимодальные распределения, которые являются абсолютно непрерывными, дискретными или комбинацией этих двух, представляют собой смеси унимодальных распределений.
Рассмотрим непрерывные распределения , PDF-файлы которых f непрерывны (это «абсолютно непрерывные» распределения). (Непрерывность не является ограничением; ее можно еще больше ослабить с помощью более тщательного анализа, предполагая лишь, что точки разрыва дискретны.) Ff
Чтобы справиться с «плато» постоянных значений, которые могут возникнуть, определите «режим» как интервал (который может быть одной точкой, где x l = x u ), такой, чтоm=[xl,xu]xl=xu
имеет постоянное значение на m , скажем, y .fm,y
не является постоянным на любом интервале, который строго содержит m .fm
Существует такое положительное число , что максимальное значение f, достигаемое на [ x l - ϵ , x u + ϵ ], равно y .ϵf[xl−ϵ,xu+ϵ]y
Пусть - любая мода f . Поскольку f непрерывна, существуют интервалы [ x ′ l , x ′ u ], содержащие m, для которых f не уменьшается в [ x ′ l , x l ] (что является правильным интервалом, а не просто точкой) и не увеличивается в [ x u , x ′ u ]m=[xl,xu]ff[x′l,x′u]mf[x′l,xl][xu,x′u](что также является правильным интервалом). Пусть - бесконечный минимум всех таких значений, а x ′ u - супремум всех таких значений.x′lx′u
Эта конструкция определила один «горб» на графике , проходящие от Купить ' л до й ' ц . Пусть y будет больше из f ( x ′ l ) и f ( x ′ u ) . По построению множество точек x в [ x ′ l , x ′ u ], для которых f ( x ) ≥ y, является собственным интервалом m ′fx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥ym′строго содержащий (потому что он содержит либо целое из [ x ′ l , x l ], либо [ x u , x ′ u ] ).m[x′l,xl][xu,x′u]
На этой иллюстрации мультимодального PDF режим обозначен красной точкой на горизонтальной оси. Горизонтальная протяженность красной части заливки - это интервал m ′ : это основание горба, определяемого модой m . Основание этого горба находится на высоте y ≈ 0,16 . Оригинальный PDF - это сумма красной и синей заливок. Обратите внимание, что у синей заливки только один режим около 2 ; оригинальный режим в [ 0 , 0 ] был удален.m=[0,0]m′my≈0.162[0,0]
Написание для длины m ′ определите|m′|m′
pm=PrF(m′)−y|m′|
и
fm(x)=f(x)−ypm
когда и е м ( х ) = 0 в противном случае. (Это делает f m непрерывной функцией, между прочим.) Числитель - это величина, на которую f поднимается выше y, а знаменатель p m - это площадь между графиком f и y . Таким образом, f m неотрицательна и имеет общую площадь 1 : это PDF распределения вероятностей. По построению он имеет уникальный режим m .x∈m′fm(x)=0fmfypmfyfm1m
Также по конструкции, функция
f′m(x)=f(x)−pmfm(x)1−pm
это PDF при условии . (Очевидно, что если p m = 1, то от f ничего не останется , что должно было быть унимодальным для начала.) Более того, у него нет мод в интервале m ′ (где он постоянен, поэтому предыдущее тщательное определение a Режим как интервал был необходим). Более того,pm<1pm=1f,m′
f(x)=pmfm(x)+(1−pm)f′m(x)
является смесью унимодального PDF и PDF f ′ m .fmf′m
Повторите эту процедуру с (которая как линейная комбинация непрерывных функций все еще является непрерывной функцией, позволяющей нам действовать как и прежде), создавая последовательность режимов m = m 1 , m 2 , … ; соответствующие последовательности весов p 1 = p m , p 2 = p m 2 , … ; и PDF-файлы f 1 = f m , f 2 = f m 2 , … .f′mm=m1,m2,…p1=pm,p2=pm2,…f1=fm,f2=fm2,…. Ограничивающий результат существует потому, что (а) интервал, в котором сглаживается, включает в себя надлежащий интервал, который не был сглажен в предыдущих операциях i - 1, и (b) действительные числа не могут быть разложены более чем на счетное число таких интервалов , Предел не может иметь никаких мод и поэтому является постоянным, который должен быть нулевым (иначе его интеграл расходился бы). Следовательно, f было выражено (возможно, не однозначно, потому что порядок, в котором были выбраны моды, будет иметь значение) как смесьfii−1f
f(x)=∑ipifi(x)
унимодальных распределений, QED.