Возможно ли иметь пару гауссовых случайных величин, для которых совместное распределение не является гауссовым?


91

Кто-то задал мне этот вопрос на собеседовании, и я ответил, что их совместное распространение всегда гауссовское. Я думал, что всегда могу написать двумерный гауссовский язык со своими средствами, дисперсией и ковариациями. Мне интересно, может ли быть случай, когда совместная вероятность двух гауссианов не является гауссовой?


4
Еще один пример из Википедии . Конечно, если переменные независимы и незначительно гауссовы, то они совместно являются гауссовыми.

Ответы:


138

Двустороннее нормальное распределение является исключением , а не правилом!

Важно признать, что «почти все» совместные распределения с нормальными маргиналами не являются двумерным нормальным распределением. То есть общая точка зрения, что совместные распределения с нормальными маргиналами, которые не являются двумерными, являются «патологическими», немного ошибочна.

Конечно, многомерная нормаль чрезвычайно важна из-за ее устойчивости при линейных преобразованиях, и поэтому ей уделяется большое внимание в приложениях.

Примеры

Полезно начать с некоторых примеров. На рисунке ниже представлены тепловые карты шести двумерных распределений, каждый из которых имеет стандартные нормальные маргинальные значения. Левый и средний в верхнем ряду - двумерные нормали, остальные - нет (как должно быть очевидно). Они описаны ниже.

Примеры двумерного распределения со стандартными нормальными маргиналами.

Голые кости связок

Свойства зависимости часто эффективно анализируются с помощью связок . Двумерным копула это просто красивое название для распределения вероятностей на единицу площади с равномерными маргинальными.[0,1]2

Предположим, что - двумерная связка. Тогда, непосредственно из вышесказанного, мы знаем, что , и , например.C(u,v)C(u,v)0C(u,1)=uC(1,v)=v

Мы можем построить двумерные случайные величины на евклидовой плоскости с заданными маргиналами простым преобразованием двумерной связки. Пусть и - предписанные маргинальные распределения для пары случайных величин . Тогда, если - двумерная связка, - двумерная функция распределения с маргиналами и . Чтобы увидеть этот последний факт, просто обратите внимание, что Тот же аргумент работает для .F 2 ( X , Y ) C ( u , v ) F ( x , y ) = C ( F 1 ( x ) , F 2 ( y ) ) F 1 F 2F1F2(X,Y)C(u,v)

F(x,y)=C(F1(x),F2(y))
F1F2
P(Xx)=P(Xx,Y<)=C(F1(x),F2())=C(F1(x),1)=F1(x).
F2

Для непрерывного и , теорема Скляр в утверждает обратимо подразумевающий уникальность. То есть, учитывая двумерное распределение с непрерывными маргиналами , , соответствующая связка является уникальной (в соответствующем пространстве диапазонов).F1F2F(x,y)F1F2

Бивариат нормальный является исключительным

Теорема Склара говорит нам (по существу), что есть только одна связка, которая производит двумерное нормальное распределение. Это метко названная гауссова связка с плотностью на где числитель - это двумерное нормальное распределение с корреляцией оцененной в и .[0,1]2

cρ(u,v):=2uvCρ(u,v)=φ2,ρ(Φ1(u),Φ1(v))φ(Φ1(u))φ(Φ1(v)),
ρΦ1(u)Φ1(v)

Но есть много других связок, и все они дадут двумерное распределение с нормальными маргиналами, которое не является двумерным нормальным, используя преобразование, описанное в предыдущем разделе.

Некоторые подробности на примерах

Обратите внимание, что если является произвольной связкой с плотностью , то соответствующая двумерная плотность со стандартными нормальными маргиналами при преобразовании есть C(u,v)c(u,v)F(x,y)=C(Φ(x),Φ(y))

f(x,y)=φ(x)φ(y)c(Φ(x),Φ(y)).

Обратите внимание, что, применяя гауссову связку в вышеприведенном уравнении, мы восстанавливаем двумерную нормальную плотность. Но для любого другого выбора мы не будем.c(u,v)

Примеры на рисунке построены следующим образом (проходя по каждой строке по одному столбцу за раз):

  1. Двустороннее нормальное с независимыми компонентами.
  2. Двустороннее нормальное с .ρ=0.4
  3. Пример , приведенный в этом ответе на Дилип Sarwate . Легко видеть, что он вызван связкой с плотностью .C(u,v)c(u,v)=2(1(0u1/2,0v1/2)+1(1/2<u1,1/2<v1))
  4. Генерируется из копулы Франка с параметром .θ=2
  5. Генерируется из копулы Клейтона с параметром .θ=1
  6. Генерируется из асимметричной модификации копулы Клейтона с параметром .θ=3

7
+1 за замечание, что двумерная нормальная плотность является исключительным случаем!
Дилип Сарвате

Может быть, я что-то упускаю, но если мы начнем с , совместное распределение определяется автоматически, независимо от конструкции связки, и если мы применяем Построение гауссовой связки для их CDF, это правда, что мы получим негауссов CDF , но эта функция в общем случае не будет CDF пары случайных величин мы начали, верно ? X1,X2N(0,1)(X1,X2)F(x1,x2)X,X2
RandomGuy

Пример того , как смоделировать , как в нижней правой панели: library(copula) kcf <- khoudrajiCopula(copula2 = claytonCopula(6), shapes = fixParam(c(.4, 1), c(FALSE, TRUE))) # force normal margins evil <- mvdc(kcf, c("norm", "norm"), list(list(mean = 0, sd =1), list(mean = 0, sd = 1))) contour(evil, dMvdc, xlim = c(-3, 3), ylim=c(-3, 3))
половина прохода

1
@RandomGuy, вы пропускаете неустановленное предположение, что . Если вы предполагаете, что они независимы, то да, вы уже знаете совместное распространение. Без предположения о независимости знание предельных распределений не дает достаточно информации для определения совместного распределения. X1,X2independentN(0,1)
MentatOfDune

25

Это правда, что каждый элемент многовариантного нормального вектора сам по себе нормально распределен, и вы можете определить их средние значения и дисперсии. Однако неверно, что любые две гуасианские случайные величины совместно распределены нормально. Вот пример:

Изменить: В ответ на согласие, что случайная величина, которая является точечной массой, может рассматриваться как нормально распределенная переменная с , я изменяю свой пример.σ2=0


Пусть и где - случайная величина . То есть каждый с вероятностью .XN(0,1)Y=X(2B1)BBernoulli(1/2)Y=±X1/2

Сначала покажем, что имеет стандартное нормальное распределение. YПо закону полной вероятности ,

P(Yy)=12(P(Yy|B=1)+P(Yy|B=0))

Следующий,

P(Yy|B=0)=P(Xy)=1P(Xy)=1Φ(y)=Φ(y)

где - стандартный нормальный CDF . По аналогии,Φ

P(Yy|B=1)=P(Xy)=Φ(y)

Следовательно,

P(Yy)=12(Φ(y)+Φ(y))=Φ(y)

Итак, CDF для есть , поэтому .YΦ()YN(0,1)

Теперь мы покажем, что совместно не распределены нормально. X,YКак указывает @cardinal, одной из характеристик многомерной нормы является то, что каждая линейная комбинация ее элементов нормально распределена. не имеют этого свойства, так какX,Y

Y+X={2Xif B=10if B=0.

Поэтому представляет собой смесь случайной величины и точечной массы в 0, поэтому она не может быть нормально распределена.Y+X50/50N(0,4)


4
Я не согласен с этим ответом. Вырожденная точечная масса при обычно считается вырожденной гауссовой случайной величиной с нулевой дисперсией. Кроме того, не являются совместно непрерывными, хотя они незначительно непрерывны. Для примера двух совместно непрерывных случайных величин, которые являются немного гауссовыми, но не совместно гауссовыми, см., Например, вторую половину этого ответа . 1μ(X,X)
Дилип Сарвате

4
@DilipSarwate, вопрос состоял в том, чтобы привести пример (если он существует) двух переменных, которые обычно распределены, но их совместное распределение не является многомерным нормальным. Это пример. Большинство стандартных определений нормального распределения (например, wikipedia en.wikipedia.org/wiki/Normal_distribution ) требуют, чтобы дисперсия была строго положительной, и, следовательно, не включала точечную массу как часть семейства нормальных распределений.
Макро

4
Стандартной характеристикой многомерного гауссова является то, что является многомерным гауссовым тогда и только тогда, когда является гауссовским для всех . Как намекает @Dilip, стоит подумать, верно ли это для вашего примера. XRnaTXaRn
кардинал

6
Поскольку вы, очевидно, не любите призывы к рациональности ;-), а как насчет обращений к власти? (Это шутка, если она не очевидна.) Я просто случайно наткнулся на это, когда искал что-то еще: Пример 2.4 , стр. 22 из GAF Seber и AJ Lee, Linear Regression Analysis , 2nd. ред., Вили. Он цитирует: «Пусть и положим ... Таким образом, имеет многомерное нормальное распределение». YN(μ,σ2)Y=(Y,Y)Y
кардинал

5
Обсуждение об определениях. Ясно, что если ковариационная матрица по определению должна быть неособой, макрос предоставляет пример, но это не пример в соответствии с более либеральным определением, которое ссылается и @cardinal. Одна веская причина предпочесть более либеральное определение - то, что тогда все линейные преобразования нормальных переменных нормальны. В частности, в линейной регрессии с нормальными ошибками остатки имеют совместное нормальное распределение, но ковариационная матрица является сингулярной.
NRH

5

Следующий пост содержит набросок доказательства, просто чтобы дать основные идеи и начать работу.

Пусть две независимые гауссовские случайные величины и пусть будет z=(Z1,Z2)x=(X1,X2)

x=(X1X2)=(α11Z1+α12Z2α21Z1+α22Z2)=(α11α12α21α22)(Z1Z2)=Az.

Каждый , но так как они являются линейными комбинациями одного и того же независимого r.vs, они совместно зависимы.XiN(μi,σi2)

Определение Пара r.vs называется двумерной нормально распределенной, если ее можно записать в виде линейной комбинации независимой нормальной r.vs .x=(X1,X2)x=Azz=(Z1,Z2)

Лемма Если - двумерный гауссов, то любая другая их линейная комбинация снова является нормальной случайной величиной.x=(X1,X2)

Доказательство . Тривиально, пропущено, чтобы никого не обидеть.

Свойство Если некоррелированы, то они независимы и наоборот.X1,X2

РаспределениеX1|X2

Предположим, что - это те же гауссовы числа, что и раньше, но давайте предположим, что они имеют положительную дисперсию и нулевое среднее значение для простоты.X1,X2

Если - это подпространство, охватываемое , пусть и .SX2X1S=ρσX1σX2X2X1S=X1X1S

X1 и являются линейными комбинациями , поэтому тоже. Они совместно являются гауссовыми, некоррелированными (доказывают это) и независимыми.X2zX2,X1S

Разложение выполняется с помощью

X1=X1S+X1S
E[X1|X2]=ρσX1σX2X2=X1S

V[X1|X2]=V[X1S]=E[X1ρσX1σX2X2]2=(1ρ)2σX12.

Тогда

X1|X2N(X1S,(1ρ)2σX12).

Две одномерные гауссовские случайные величины совместно являются гауссовыми, если условия и тоже гауссовы.X,YX|YY|X


2
Не ясно, как это наблюдение отвечает на вопрос. Поскольку правило произведения - это практически определение условного распределения, оно не является особенным для бинормальных распределений. Последующее утверждение «тогда по порядку ...» не дает никакой причины: именно поэтому условные распределения также должны быть нормальными?
whuber

но я отвечаю на главный вопрос: «Мне интересно, может ли быть случай, когда совместная вероятность двух гауссианцев не является гауссовой?». Итак, ответ таков: когда условное не нормально. - Вспомогательный
Вспомогательный

2
Не могли бы вы завершить эту демонстрацию? Прямо сейчас это только утверждение с вашей стороны, без доказательств. Совершенно не очевидно, что это правильно. Это также неполным, потому что вы должны установить существование: то есть, вы должны продемонстрировать это на самом деле возможно для совместного распределения , чтобы иметь нормальные маргинальные , но для которых по крайней мере один условный не является нормальным. Теперь на самом деле это тривиально, потому что вы можете свободно изменять каждое условное распределение бинармы на множестве нулевой меры без изменения ее маргиналов - но эта возможность, казалось бы, противоречит вашим утверждениям.
whuber

Привет @ whuber, я надеюсь, это поможет больше. У вас есть предложения или изменения? Я написал это очень быстро, так как на данный момент у меня не так много свободного времени :-), но я буду признателен за любые предложения или улучшения, которые вы можете сделать. Лучшее
вспомогательное

(1) Что вы пытаетесь доказать? (2) Поскольку вопрос заключается в том, когда распределение с гауссовыми маргиналами не является совместно гауссовским, я не вижу, как этот аргумент приводит к чему-либо значимому.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.