Распределение в форме плато?


30

Я ищу распределение, в котором плотность вероятности быстро уменьшается после некоторой точки, находящейся вдали от среднего значения, или, по моим собственным словам, «распределение в форме плато».

Что-то среднее между гауссовым и униформой.


8
Вы можете суммировать гауссовское RV и равномерное RV.
StrongBad

3
Иногда можно услышать о так называемых платикуртических распределениях.
JM не является статистиком

Ответы:


53

Возможно, вы ищете распределение, известное под названиями обобщенного нормального (версия 1) , распределения Subbotin или экспоненциального распределения мощности. Он параметризован местоположением , масштабом и формой с pdfμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

как вы можете заметить, для оно напоминает распределение Лапласа и сходится к нему, при оно сходится к нормальному, а когда к равномерному распределению.β=1β=2β=

введите описание изображения здесь

Если вы ищете программное обеспечение, в котором оно реализовано, вы можете проверить normalpбиблиотеку на R (Mineo and Ruggieri, 2005). Что приятно в этом пакете, так это то, что он, помимо прочего, реализует регрессию с обобщенными нормально распределенными ошибками, то есть минимизирует норму .Lp


Mineo, AM & Ruggieri, M. (2005). Программный инструмент для экспоненциального распределения мощности: пакет normalp. Журнал статистического программного обеспечения, 12 (4), 1-24.


20

Комментарий @ StrongBad - действительно хорошее предложение. Сумма равномерного RV и гауссова RV может дать вам именно то, что вы ищете, если правильно выбрать параметры. И это на самом деле имеет довольно хорошее решение в закрытой форме.

PDF этой переменной дается выражением:

14a[erf(x+aσ2)erf(xaσ2)]

- это «радиус» равномерного среднего значения RV. σ - стандартное отклонение среднего значения по Гауссу.aσ

PDF-файлы


3
Ссылка: Бхаттачарджи Г.П., Пандит С.Н.Н. и Мохан Р. 1963. Размерные цепочки, включающие прямоугольные и нормальные распределения ошибок. Technometrics, 5, 404–406.
Тим

15

Существует бесконечное количество «платообразных» распределений.

Вы хотели что-то более конкретное, чем «между гауссовой и униформой»? Это несколько расплывчато.

Вот один простой: вы всегда можете прикрепить половину нормальной на каждом конце униформы:

Плотность с равномерным центром и гауссовыми хвостами

Вы можете контролировать «ширину» униформы относительно шкалы нормали, чтобы иметь более широкие или более узкие плато, предоставляя целый класс распределений, которые включают гауссову и униформу в качестве предельных случаев.

Плотность составляет:

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

где h=11+w/(2πσ)

При для фиксированного w мы приближаемся к униформе на ( µ - w / 2 , µ + w / 2 ), а при w 0 для фиксированного σ мы приближаемся к N ( µ , σ 2 ) .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

Вот несколько примеров (с в каждом случае):μ=0

Сюжет о различных примерах этой униформы с гауссовым хвостом

Мы могли бы, возможно, назвать эту плотность «униформой с гауссовым хвостом».


1
Ach! Я люблю посещать официальные балы в униформе с гауссовским хвостом! ;)
Алексис

7

Смотрите мое распределение "Башня дьявола" здесь [1]:

f(x)=0.3334|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

Функция плотности башни дьявола с плоской вершиной, выпуклыми сторонами, отрезанными в крайних точках

Распределение «слип-платья» еще интереснее.

Распределения, имеющие любую форму, легко создать.

[1]: Westfall, PH (2014)
"Kurtosis as Peakness, 1905 - 2014. RIP"
Am. Стат. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
публичный доступ pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Привет Питер - я позволил себе дать функцию и вставить изображение, а также дать полную ссылку. (Если память не изменяет, я думаю, что Кендалл и Стюарт рассказывают подробности подобного разоблачения в их классическом тексте. Если я правильно помню - это было давно - я полагаю, они также обсуждают, что это не грубость)
Glen_b

Спасибо, Glen_b. Я никогда не говорил, что куртоз измеряет то, что измеряют числа индекса хвоста. Скорее, моя статья доказывает, что эксцесс для очень широкого класса распределений почти равен E (Z ^ 4 * I (| Z |> 1)). Таким образом, эксцесс явно ничего не говорит о «пике», который обычно находится в диапазоне {Z: | Z | <1}. Скорее это определяется в основном хвостами. Назовите это E (Z ^ 4 * I (| Z |> 1)), если у термина «тяжеловесность» есть другое значение.
Питер Уэстфолл,

Кроме того, @Glen_b, какой хвостовой индекс вы имеете в виду? Их бесконечно много. Хвостовые переходы не определяют «хвостатость» должным образом. Согласно некоторым определениям пересечения хвоста тяжести хвоста, N (0,1) более «тяжелохвостый», чем .9999 * U (-1,1) + .0001 * U (-1000,1000), хотя последний очевидно, более тяжелый хвост, несмотря на наличие конечных хвостов. И, кстати, последний имеет чрезвычайно высокий эксцесс, в отличие от N (0,1).
Питер Вестфолл

Я не могу найти, чтобы я говорил "хвостовой указатель" в моем комментарии; Я не совсем уверен, что вы имеете в виду, когда говорите «на какой хвостовой индекс вы ссылаетесь». Если вы имеете в виду немного о тяжелохвостости, лучше всего проверить, что на самом деле говорят Кендалл и Стюарт; Я полагаю, что они фактически сравнивают асимптотическое отношение плотностей для симметричных стандартизированных переменных, но, возможно, это были функции выживших; дело было их, а не мое
Glen_b

Странный. Ну, в любом случае, Кендалл и Стюарт ошиблись. Куртоз, очевидно, является мерой веса хвоста, как доказывают мои теоремы.
Питер

5

f(x)

f(x)=k11+x2afor xR

где:

  • a
  • kk=aπsin(π2a)

a

введите описание изображения здесь

,

a

введите описание изображения здесь


3

Еще один ( РЕДАКТИРОВАТЬ : Я упростил это сейчас. РЕДАКТИРОВАТЬ 2 : Я упростил это еще дальше, хотя сейчас картина не отражает это точное уравнение):

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

журнал(сЬ(Икс))Икс

aLпчасaaзнак равно2бзнак равно1


Вот пример кода в R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fэто наше распространение. Давайте построим это для последовательностиx

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Консольный вывод:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

И сюжет:

My distribution based on log cosh

Вы можете изменить aи b, приблизительно, начало и конец склона соответственно, но тогда потребуется дальнейшая нормализация, и я не рассчитал ее (поэтому я использую a = 2и b = 1в сюжете).


2

Если вы ищете что-то очень простое, с центральным плато и сторонами распределения треугольника, вы можете, например, объединить N распределений треугольника, N в зависимости от желаемого соотношения между плато и спуском. Почему треугольники, потому что их функции выборки уже существуют в большинстве языков. Вы случайным образом сортируете одного из них.

В R это дало бы:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

enter image description here enter image description here


2

Вот симпатичный: продукт двух логистических функций.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Это дает преимущество не быть кусочным.

B регулирует ширину, а A регулирует крутизну падения. Ниже показаны B = 1: 6 с A = 2. Примечание: я не нашел время, чтобы выяснить, как правильно это нормализовать.

Plateau distribution

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.