Почему сумма двух случайных величин является сверткой?


33

Долгое время я не понимал, почему «сумма» двух случайных величин является их сверткой , тогда как сумма функции плотности смеси суммы и равнаf(x)g(x)pf(x)+(1p)g(x)n; арифметическая сумма, а не их свертка. Точная фраза «сумма двух случайных величин» появляется в Google 146 000 раз и имеет эллиптическую форму следующим образом. Если считать, что RV дает одно значение, то это одно значение может быть добавлено к другому отдельному значению RV, которое не имеет ничего общего со сверткой, по крайней мере, не напрямую, а является суммой двух чисел. Результат RV в статистике, однако, представляет собой набор значений, и, таким образом, более точная фраза будет выглядеть примерно так: «набор согласованных сумм пар связанных индивидуальных значений из двух RV - это их дискретная свертка» ... и может быть аппроксимирован свертка функций плотности, соответствующих этим RV. Еще более простой язык: 2 RV'sn-сэмплы - это фактически два n-мерных вектора, которые складываются как их векторная сумма.

Пожалуйста, покажите детали того, как сумма двух случайных величин является сверткой и суммой.


6
Я действительно не верю, что это «сумма» в абстрактном алгебраическом смысле. Когда мы делаем «сумму переменных», мы ссылаемся на типичную арифметическую операцию, которую мы знаем при добавлении натуральных чисел или действительных чисел. Это означает, что мы создаем новую переменную, «складывая» другие переменные вместе. Понятие «сумма переменных» также существует вне области статистики и не зависит от выражений о свертках и вероятностях. Таким образом, «сумма переменных - это свертка», это неверно. Но никто не намекает на это. Мы должны изменить слово «есть» в этом утверждении.
Секст Эмпирик

5
Это все равно что утверждать, что не следует называть «произведением двух функций f и g» (или только интерпретировать как некоторое абстрактное алгебраическое понятие «продукта»), потому что это свертка в терминах преобразований Фурье этих функций. f(x)g(x)
Секст Эмпирик

16
«Уведомление» вводит в заблуждение. Сумма случайных величин и обозначается точно в том же смысле, что «сумма» понимается школьниками: для каждого значение определяется путем сложения чисел иВ этом нет ничего абстрактного. Эти RVs имеют распределения. Существует много способов представления распределений. Функция распределения - свертка ДФ и Y ; характеристической функцией X + Y является произведениеXYω(X+Y)(ω)X(ω)Y(ω).X+YXYX+Yих CF; производящая функция кумулянта X+Y является суммой их CGF; и так далее.
whuber

3
Я не вижу ни случайных переменных, ни распределений в ваших расчетах.
whuber

8
На языке моего поста по адресу stats.stackexchange.com/a/54894/919 пара случайных величин состоит из коробки с билетами, на каждой из которых написаны два числа, одно обозначено а другое Сумма этих случайных величин получается путем сложения двух чисел, найденных в каждом билете. Вычисление в буквальном смысле является задачей, которую вы можете назначить в классе третьего класса. (Я подчеркиваю, что подчеркиваю фундаментальную простоту операции, а также показываю, насколько сильно она связана с тем, что каждый понимает под «суммой».)(X,Y)XY.
whuber

Ответы:


14

Сверточные вычисления, связанные с распределением случайных величин, являются математическими проявлениями закона полной вероятности .


На языке моего поста, что означает «случайная величина»? ,

Пара случайных величин состоит из коробки билетов на каждой из которых записаны два числа, один назначенный , а другой . Сумма этих случайных величин получается путем сложения двух чисел, найденных в каждом билете.(X,Y)XY

Я разместил фотографию такой коробки и ее билетов в разделе «Разъяснение понятия суммы случайных величин» .

введите описание изображения здесь

Это вычисление буквально является задачей, которую вы можете поручить классной комнате третьего класса. (Я подчеркиваю, что подчеркиваю фундаментальную простоту операции, а также показываю, насколько сильно она связана с тем, что каждый понимает под «суммой».)

То, как математически выражается сумма случайных величин, зависит от того, как вы представляете содержимое поля:

Первые два из них являются особыми, поскольку в коробке могут отсутствовать pmf, pdf или mgf, но всегда есть cdf, cf и cgf.


Чтобы понять, почему свертка является подходящим методом для вычисления pmf или pdf из суммы случайных величин, рассмотрим случай, когда все три переменные и имеют pmf: по определению pmf для в любое число дает долю билетов в коробке, где сумма равна записанная какX, Y,X+YX+YzX+Yz,Pr(X+Y=z).

PMF суммы определяется путем разбивки набора билетов в соответствии со значением написанным на них, в соответствии с Законом полной вероятности, который устанавливает пропорции (непересекающихся подмножеств). Более технически,X

Доля заявок, найденных в коллекции непересекающихся подмножеств коробки, является суммой пропорций отдельных подмножеств.

Применяется таким образом:

Доля билетов, где , написанная должна равняться сумме по всем возможным значениям доли билетов, где и написаннаяX+Y=zPr(X+Y=z),xX=xX+Y=z,Pr(X=x,X+Y=z).

Поскольку и подразумевают это выражение может быть переписано непосредственно в терминах исходных переменных и какX=xX+Y=zY=zx,XY

Pr(X+Y=z)=xPr(X=x,Y=zx).

Это свертка.


редактировать

Обратите внимание, что хотя свертки связаны с суммами случайных величин, они не являются самими свертками!

Действительно, в большинстве случаев невозможно свести две случайные величины. Чтобы это работало, их домены должны иметь дополнительную математическую структуру. Эта структура является непрерывной топологической группой.

Не вдаваясь в детали, достаточно сказать, что свертка любых двух функций должна абстрактно выглядеть примерно так:X,Y:GH

(XY)(g)=h,kGh+k=gX(h)Y(k).

(Сумма может быть интегралом, и, если это приведет к получению новых случайных величин из существующих, должна быть измеримой всякий раз, когда и ; это то место, где должно прийти некоторое рассмотрение топологии или измеримости.)XYXY

Эта формула вызывает две операции. Одним из них является умножение на должно иметь смысл умножать значения и Другое - сложение на должно иметь смысл добавлять элементыH:X(h)HY(k)H.G:G.

В большинстве вероятностных приложений представляет собой набор чисел (действительных или комплексных), а умножение является обычным. Но пространство выборок часто вообще не имеет математической структуры. Вот почему свертка случайных величин обычно даже не определяется. Объекты, участвующие в свертках в этом потоке, являются математическими представлениями распределений случайных величин. Они используются для вычисления распределения суммы случайных величин с учетом совместного распределения этих случайных величин.HG,


Ссылки

Стюарт и Орд, Продвинутая теория статистики Кендалла, том 1. Пятое издание, 1987, главы 1, 3 и 4 ( Распределения частот, моменты и кумулянты и характеристические функции ).


Ассоциативность со скалярным умножением из алгебраических свойств что для любого действительного (или комплексного) числа . В то время как одно приятное свойство состоит в том, что свертка двух функций плотности является функцией плотности, одна не ограничивается сверткой функций плотности, и свертка в общем случае не является вероятностной обработкой, конечно, это может быть, но это может быть обработка временных рядов например, обработка сточных вод в озерах после дождя, модель концентрации лекарственного средства после дозировки и т. д.
a(fg)=(af)g
a
Карл

@Carl Как этот комментарий согласуется с вашим первоначальным вопросом, который спрашивает о суммах случайных величин ? В лучшем случае это тангенциально.
whuber

Я прошу вас не чрезмерно обобщать. Начать предложение с "свертка есть", не говоря "свертка RV's есть" эллиптическое. Вся моя проблема здесь была с эллиптической нотацией. Сложение векторов двух векторов в пространстве является сверткой независимо от того, нормализованы ли эти векторы. Если они нормализованы, у них не должно быть вероятностей, в этом вся правда, а не только ее часть. n
Карл

Спасибо. Я уточню первое предложение, чтобы подчеркнуть, что я отвечаю на ваш вопрос.
whuber

Новое дополнение верно для свертки RV, что технически является тем, что я спросил. И, возможно, я сомневаюсь, но свертка не всегда относится к RV, но всегда может быть сведена к некоторым масштабным коэффициентам функций плотности, умноженным на те функции плотности, где скаляры мультипликативны и где функции плотности иногда являются RV, и в этом случае масштабные коэффициенты мультипликативная идентичность, т. е. 1.
Карл

41

Обозначения, прописные и строчные

https://en.wikipedia.org/wiki/Notation_in_probability_and_statistics

  • Случайные величины обычно пишутся прописными буквами: , и т. Д.XY
  • Конкретные реализации случайной величины пишутся соответствующими строчными буквами. Например, , ,…, может быть выборкой, соответствующей случайной переменной и кумулятивная вероятность формально записывается как чтобы отличить случайную переменную от реализации.x1x2xnXP(X>x)

Z=X+Y означаетzi=xi+yixi,yi


Смесь переменных -> сумма PDF

https://en.wikipedia.org/wiki/Mixture_distribution

Вы используете сумму функций плотности вероятности и когда вероятность (скажем, Z) определяется одной суммой различных вероятностей.fX1fX2

Например, когда представляет собой долю времени, определенного в и долю времени, определенного в , тогда вы получаете иZsX11sX2

P(Z=z)=sP(X1=z)+(1s)P(X2=z)
fZ(z)=sfX1(z)+(1s)fX2(z)

, , , , Примером является выбор между бросками игральных костей с шестигранными или 12-ти кубиками. Скажем, вы делаете 50-50 процентов времени один кубик или другой. Тогда

fmixedroll(z)=0.5f6sided(z)+0.5f12sided(z)


Сумма переменных -> свертка PDF

https://en.wikipedia.org/wiki/Convolution_of_probability_distributions

Вы используете свертку функций плотности вероятности и когда вероятность (скажем, Z) определяется несколькими суммами разных (независимых) вероятностей.fX1fX2

Например, когда (т. Сумма!) И несколько разных пар суммируют до , причем каждая вероятность . Тогда вы получите сверткуZ=X1+X2 x1,x2zfX1(x1)fX2(x2)

P(Z=z)=all pairs x1+x2=zP(X1=x1)P(X2=x2)

и

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)

или для непрерывных переменных

fZ(z)=x1 domain of X1fX1(x1)fX2(zx1)dx1

, , , , Примером является сумма двух бросков костей для иfX2(x)=fX1(x)=1/6x{1,2,3,4,5,6}

fZ(z)=x{1,2,3,4,5,6} and zx{1,2,3,4,5,6}fX1(x)fX2(zx)

Заметьте, я решил интегрировать и суммировать , что, на мой , более интуитивно понятно, но в этом нет необходимости, и вы можете интегрировать из в если определите вне домена.x1 domain of X1fX1(x1)=0

Пример изображения

пример «суммы переменных», приводящей к «свертке PDF-файлов»

Пусть будет . Чтобы узнать вам нужно будет интегрировать по вероятностям для всех реализаций которые привести к .ZX+YP(z12dz<Z<z+12dz)x,yz12dz<Z=X+Y<z+12dz

Так что это интеграл от в области вдоль линии .f(x)g(y)±12dzx+y=z


Автор StackExchangeStrike


6
@ Карл, это не жаргонно. Свертка действительно может рассматриваться как сумма многих сумм. Но это не то, что означает «сумма переменных» . Это относится к таким вещам, как когда мы говорим о «сумме двух бросков костей», которая имеет очень нормальное значение и интерпретацию в повседневной жизни (особенно когда мы играем в настольную игру). Вы бы предпочли сказать, что мы берем комбинацию двух бросков костей, когда используем алгебраическую сумму двух бросков костей?
Секст Эмпирик

2
Вероятность броска 7 с (единственной) суммой двух кубиков является суммой (многих) вероятностей броска 1-6, 2-5, 3-4, 4-3, 5-2, 6-1. Термин сумма встречается два раза, и в первом случае, когда он относится к одному выражению суммирования, это то, к чему относится выражение «сумма двух переменных», например, «сумма двух бросков костей».
Секст Эмпирик

5
Действительно, интеграл заменяет сумму вероятностей. Но это относится ко второму использованию термина sum, а не к первому использованию термина sum. Таким образом, мы все еще можем ссылаться на сумму двух переменных (что является первым использованием термина). Это связано с тем, что термин «сумма» используется не для обозначения операции свертки или операции суммирования вероятностей, а для суммирования переменных.
Секст Эмпирик

8
по крайней мере, нелепо утверждать, что «плотность вероятности для суммы бросков костей определяется сверткой плотностей вероятностей для отдельных бросков костей». Термин «сумма бросков кубиков» имеет очень нормальное толкование в повседневной жизни, когда вокруг жаргона нет статистиков. Именно в этом смысле (сумма бросков кубиков) вам нужно интерпретировать (сумму переменных). Этот шаг не является ни жаргонским. Люди постоянно используют «суммы переменных». Только статистик думает о вероятностях для этих сумм и начинает применять свертки
Sextus Empiricus

2
@Carl: я думаю, вы неправильно поняли мое заявление. Вы говорили, что нехорошо называть свертку интегралом суммой, подразумевая, что кто-то называет свертку интегралом суммой. Но никто здесь не говорит это. То, что было сказано, - то, что интеграл свертки - pdf суммы определенных переменных. Вы меняли утверждение на что-то ложное, а затем жаловались, что оно ложное.

28

Ваша путаница, кажется, возникает из-за объединения случайных величин с их распределением.

Чтобы «разучить» эту путаницу, это может помочь сделать пару шагов назад, на мгновение опустошить ваш разум, забыть о любых причудливых формализмах, таких как вероятностные пространства и сигма-алгебры (если это поможет, представьте, что вы снова в начальной школе) и никогда не слышал о таких вещах!) и просто подумайте о том, что представляет собой случайная переменная: число, в значении которого мы не уверены .

Например, допустим, у меня в руке шестигранный кубик. (Я действительно знаю. На самом деле, у меня есть целая сумка.) Я еще не свернул ее, но собираюсь, и я решил позвонить по номеру, который еще не выпал на том кубике имя " ".X

Что я могу сказать об этом , без фактически броска кубика и определении его стоимости? Ну, я могу сказать, что его значение не будет , или , или . На самом деле, я могу точно сказать, что это будет целое число от до включительно, потому что это единственные числа, отмеченные на кристалле. И поскольку я купил этот мешок с кубиками у известного производителя, я могу быть совершенно уверен, что когда я действительно брошу кубик и определу, какое на самом деле число , то одинаково вероятно будет любое из этих шести возможных значений или как можно ближе к этому. как я могу определить.X711216X

Другими словами, мой является целочисленной случайной величиной, равномерно распределенной по набору .X{1,2,3,4,5,6}


Хорошо, но, конечно, все это очевидно, так почему я продолжаю ласкать такие тривиальные вещи, которые вы наверняка уже знаете? Это потому, что я хочу высказать другое замечание, которое также тривиально, но в то же время крайне важно: я могу заниматься математикой с этим , даже если я еще не знаю его значение!X

Например, я могу решить добавить один к числу которое я брошу на кристалле, и назову этот номер именем " ". Я не буду знать, каким будет это число , поскольку я не знаю, каким будет , пока я не брошу кубик, но я все еще могу сказать, что будет на единицу больше , или в математических терминах .XQQXQXQ=X+1

И это будет также случайная величина, потому что я еще не знаю , его значение; Я просто знаю , что это будет один больше , чем . И потому , что я знаю , что значения можно взять, и насколько вероятно, принять каждый из этих значений, я могу также определить те вещи , для . И вы тоже, достаточно легко. Вам на самом деле не понадобятся какие-то причудливые формализмы или вычисления, чтобы выяснить, что будет целым числом от до , и что с одинаковой вероятностью (если предположить, что мой кубик настолько же справедлив и сбалансирован, как я думаю), взять любое из этих значений.QXXQQ27

Но это еще не все! С таким же успехом я мог бы решить, скажем, умножить число которое я брошу кубик, на три, и назвать результат . И это еще одна случайная величина, и я уверен, что вы также можете выяснить ее распределение, не прибегая к каким-либо интегралам, сверткам или абстрактной алгебре.XR=3X

И если бы я действительно хотел, я мог бы даже решить взять все еще подлежащее определению число и сложить, раскрутить и исказить его, разделить его на два, вычесть одно из него и возвести в квадрат результат. И получающееся число - еще одна случайная величина; на этот раз он не будет ни целочисленным, ни равномерно распределенным, но вы все равно сможете легко определить его распределение, используя только элементарную логику и арифметику.XS=(12X1)2


Итак, я могу определить новые случайные переменные, подключив свой неизвестный кубик к различным уравнениям. Ну и что? Ну, помнишь, когда я сказал, что у меня целый пакет с кубиками? Позвольте мне взять еще один и позвонить по номеру, который я собираюсь накатить на этот кристалл, под именем « ».XY

Эти два кубика, которые я вытащил из сумки, в значительной степени идентичны - если вы поменяете их местами, когда я не смотрю, я не смогу сказать - поэтому я могу с уверенностью предположить, что этот также будет иметь то же распределение, что и , Но я действительно хочу бросить оба кубика и посчитать общее количество пипсов на каждом из них . И это общее количество пипсов, которое также является случайной величиной, поскольку я еще не знаю его , я назову « ».YXT

Насколько большим будет это число ? Хорошо, если есть число пунктов я качусь на первую пресс - форме, а этого числа пунктов я качусь на второй прессе - форме, то будет , очевидно, их сумма, т.е. . И я могу сказать, что, поскольку и оба между одним и шестью, должно быть по крайней мере два и самое большее двенадцать. И поскольку и оба являются целыми числами, очевидно, также должно быть целым числом.TXYTT=X+YXYTXYT


Но насколько вероятно, что примет каждое из возможных значений от двух до двенадцати? Определенно, вряд ли каждый из них будет одинаково вероятен - некоторые эксперименты покажут, что намного сложнее бросить двенадцать на пару костей, чем бросить, скажем, семерку.T

Чтобы понять это, позвольте мне обозначить вероятность того, что я брошу число на первом кубике (тот, результат которого я решил назвать ) выражением . Точно так же я обозначу вероятность того, что число на втором кристалле будет выброшено через . Конечно, если мои кости совершенно справедливы и сбалансированы, то для любых и от одного до шести, но мы могли бы также рассмотреть более общие случай, когда игральные кости могут быть предвзятыми, и с большей вероятностью выбрасывают одни числа, чем другие.aXPr[X=a]bPr[Y=b]Pr[X=a]=Pr[Y=b]=16ab

Теперь, поскольку два броска кубика будут независимыми (я, конечно, не планирую обманывать и корректировать один из них на основе другого!), Вероятность того, что я брошу на первом кубике и на втором, просто быть произведением этих вероятностей:a b

Pr[X=a and Y=b]=Pr[X=a]Pr[Y=b].

(Обратите внимание, что приведенная выше формула справедлива только для независимых пар случайных величин; она, безусловно, не будет выполняться, если мы заменим выше, скажем, !)YQ

Теперь, есть несколько возможных значений и которые могут привести к одному и тому же общему значению ; например, может возникнуть также из и как из и , или даже из и . Но если бы я уже бросил первый кубик и знал значение , то я мог бы точно сказать, какое значение мне нужно будет бросить на втором кубике, чтобы достичь любого заданного общего числа пипсов.XYTT=4X=1Y=3X=2Y=2X=3Y=1X

В частности, скажем, нас интересует вероятность того, что для некоторого числа . Теперь, если я знаю после броска первого кристалла, что , то я мог бы получить общее значение только бросив на втором кристалле. И, конечно же, мы уже знаем, даже не бросая кубики, что априорная вероятность броска на первом кристалле и на втором кристалле равнаT=ccX=aT=cY=caaca

Pr[X=a and Y=ca]=Pr[X=a]Pr[Y=ca].

Но, конечно, у меня есть несколько возможных способов достижения одинакового общего значения , в зависимости от того, что я в итоге бросаю на первом кубике. Для того, чтобы получить полную вероятность свертывать пипсов на двух кубиках, мне нужно сложить вероятности всех различных способов , которыми я мог катиться этот итог. Например, общая вероятность того, что я выпаду всего 4 пипса на двух кубиках, будет:cPr[T=c]c

Pr[T=4]=Pr[X=1]Pr[Y=3]+Pr[X=2]Pr[Y=2]+Pr[X=3]Pr[Y=1]+Pr[X=4]Pr[Y=0]+

Обратите внимание, что с этой суммой я зашел слишком далеко: конечно, не может быть ! Но математически это не проблема; нам просто нужно определить вероятность невозможных событий, таких как (или или или ), как ноль. И таким образом, мы получаем общую формулу для распределения суммы двух бросков кубика (или, в более общем случае, любых двух независимых целочисленных случайных величин):Y0Y=0Y=7Y=1Y=12

T=X+YPr[T=c]=aZPr[X=a]Pr[Y=ca].

И я вполне мог бы остановить свою экспозицию здесь, даже не упомянув слово «свертка»! Но, конечно, если вы знаете, как выглядит дискретная свертка , вы можете узнать ее в формуле выше. И это один довольно продвинутый способ изложения элементарного результата, полученного выше: функция массы вероятности суммы двух целочисленных случайных величин представляет собой дискретную свертку функций вероятности массы слагаемых.

И, конечно же, заменив сумму интегралом, а массу вероятности - плотностью вероятности , мы получим аналогичный результат и для непрерывно распределенных случайных величин. И, достаточно расширив определение свертки, мы можем даже применить его ко всем случайным переменным, независимо от их распределения - хотя в этот момент формула становится почти тавтологией, так как мы почти полностью определили свертку двух произвольные распределения вероятностей должны быть распределением суммы двух независимых случайных величин с этими распределениями.

Но, несмотря на это, все эти вещи со свертками и распределениями, PMF и PDF на самом деле являются просто набором инструментов для вычисления вещей о случайных переменных. Основные объекты , которые мы счетные вещи о самом по себе являются случайным переменными, которые на самом деле являются только числом, значения которых мы не уверен .

И кроме того, этот трюк со сверткой работает , в любом случае, только для сумм случайных величин. Если бы вы хотели знать, скажем, распределение или , вам пришлось бы выяснить это с помощью элементарных методов, и результат не был бы сверточным.U=XYV=XY


Приложение: Если вам нужна общая формула для вычисления распределения суммы / произведения / экспоненты / любой комбинации двух случайных переменных, вот один из способов написать одну из них: где обозначает произвольную двоичную операцию, а - это скобка Айверсона , т.е.

A=BCPr[A=a]=b,cPr[B=b and C=c][a=bc],
[a=bc]
[a=bc]={1if a=bc, and0otherwise.

(Обобщение этой формулы для недискретных случайных величин оставлено в качестве упражнения в основном бессмысленном формализме. Дискретного случая вполне достаточно, чтобы проиллюстрировать основную идею, а недискретный случай просто добавляет кучу неуместных осложнений.)

Вы можете проверить, что эта формула действительно работает, например, для сложения, и что для частного случая добавления двух независимых случайных величин она эквивалентна формуле «свертки», приведенной ранее.

Конечно, на практике эта общая формула гораздо менее полезна для вычислений, поскольку включает в себя сумму по двум неограниченным переменным вместо одной. Но в отличие от формулы с одной суммой, она работает для произвольных функций двух случайных переменных, даже необратимых, и также явно показывает операцию вместо того, чтобы маскировать ее как обратную (как формула «свертка» маскирует сложение как вычитание).


Ps. Я просто бросил кости. Оказывается, что и , что означает, что , , , , и . Теперь ты знаешь. ;-)X=5Y=6Q=6R=15S=2.25T=11U=30V=15625


4
Это должен быть принятый ответ! Очень интуитивно и понятно!
Владислав Довгальец

3
@Carl: Дело в том, что я пытаюсь сделать это , что сумма случайных величин действительно простая сумма: . Если мы хотим вычислить распределение по , то мы должны сделать что - то более сложное, но это вопрос второстепенный. Случайная переменная не является ее распределением. (Действительно, случайная переменная даже не полностью характеризуется своим распределением, так как одно (предельное) распределение не кодирует информацию о ее возможных зависимостях с другими переменными.)T=X+YT
Ilmari Karonen

3
@Carl: ... В любом случае, если вы хотите ввести специальный символ для «сложения случайных величин», то для согласованности у вас также должны быть специальные символы для «умножения случайных величин» и «деления случайных величин» и «возведение в степень случайных величин» и «логарифм случайных величин» и так далее. Все эти операции прекрасно определены для случайных величин, которые рассматриваются как числа с неопределенным значением , но во всех случаях вычисление распределения результата намного сложнее, чем просто соответствующее вычисление констант.
Илмари Каронен

5
@Carl: путаница исчезает, когда вы перестаете путать случайную переменную с ее распределением. Принятие распределения случайной величины не является линейной операцией в каком-либо осмысленном смысле, поэтому распределение суммы двух случайных переменных (обычно) не является суммой их распределений. Но то же самое верно для любой нелинейной операции. Конечно, вас не смущает тот факт, что , так почему вы должны быть смущены тем фактом, что ? x+yx+yPr[X+Y=c]Pr[X=c]+Pr[Y=c]
Илмари Каронен

3
@Carl: Подожди, что? Я рулон две кости, записывают результаты и , а затем рассчитать . Как это не обычное деление? (И да, это все еще обычное деление, даже если я делаю это до того, как брошу кости. В этом случае значения и просто еще не зафиксированы, и, следовательно, ни значение )XYZ=X/YXYZ
Ильмари Каронен

7

На самом деле я не думаю, что это совершенно правильно, если я не понимаю вас.

Если и являются независимыми случайными величинами, то отношение сумма / свертка, на которое вы ссылаетесь, выглядит следующим образом: То есть функция плотности вероятности (pdf) суммы равно свертке (обозначаемой оператор) индивид PDF в из и .XY

p(X+Y)=p(X)p(Y)
XY

Чтобы понять, почему это так, рассмотрим, что при фиксированном значении сумма следует за pdf , сдвинутой на величину . Таким образом, если вы рассмотрите все возможные значения , распределение дается путем замены каждой точки в копией центром в этой точке (или наоборот), а затем суммирования по всем этим копиям. , что именно то, что свертка.X=xS=X+YYxXSp(X)p(Y)

Формально мы можем записать это как: или, что эквивалентно:

p(S)=pY(Sx)pX(x)dx
p(S)=pX(Sy)pY(y)dy

Изменить: Надеюсь, чтобы устранить некоторую путаницу, позвольте мне суммировать некоторые вещи, которые я сказал в комментариях. Сумма двух случайных величин и не относится к сумме их распределений. Это относится к результату суммирования их реализации. Чтобы повторить пример, который я привел в комментариях, предположим, что и - числа, брошенные с броском двух кубиков ( - число, брошенное одним кубиком , а - число, брошенное другим). Тогда давайте определимXYXYXYS=X+Yкак общее количество брошенных с двумя кубиками вместе. Например, для данного броска игральных костей мы можем бросить 3 и 5, и поэтому сумма будет равна 8. Теперь возникает вопрос: как выглядит распределение этой суммы и как оно связано с отдельными распределениями из и ? В этом конкретном примере число, выбрасываемое каждым кристаллом, следует (дискретному) равномерному распределению между [1, 6]. Сумма следует треугольному распределению между [1, 12] с пиком в 7. Как оказалось, это треугольное распределение может быть получено путем свертки равномерных распределений и , и это свойство фактически справедливо для всех сумм ( независимые) случайные величины.XYXY


Суммирование многих сумм является более объединяющим, чем единственная сумма, которую стоит отметить знаком «+». Я бы предпочел сказать, что случайные величины объединяются путем свертки.
Карл

6
Конечно, свертку можно назвать суммой многих сумм. Но вы должны понимать, что свертка относится строго к PDF-файлам суммируемых переменных. Сами переменные не свернуты. Они просто добавляются друг к другу, и нет способа истолковать это сложение как операцию свертки (поэтому основная предпосылка вашего вопроса, как сейчас говорится, неверна).
Рубен ван Берген

4
Вы неправильно понимаете эту ссылку. В нем говорится: распределение вероятностей суммы двух или более независимых случайных величин является сверткой их индивидуальных распределений . Это не говорит о том, что сумма двух случайных переменных такая же, как свертка этих переменных. Это говорит о том, что распределение суммы является сверткой распределения отдельных переменных. Случайная величина и ее распределение - это две разные вещи.
Рубен ван Берген

Конечно, вы можете свертывать случайные величины. Но свойство суммы / свертки, которое широко известно и обсуждается в этой статье (и в моем ответе выше), не имеет дело со свертками случайных величин. Это особенно касается сумм случайных величин и свойств распределения этой суммы.
Рубен ван Берген

1
(«Конечно, вы можете свертывать случайные переменные». Можете ли вы? Я понимаю, что, поскольку, чтобы получить функцию распределения суммы случайных величин, вы сворачиваете функции массы / плотности каждой, многие люди говорят (свободно) о сворачивающихся распределениях, и некоторые говорят (ошибочно) о свертывании случайных величин. Извините, что отступаю, но мне любопытно.)
Scortchi - Восстановить Монику

6

Начните с рассмотрения набора всех возможных различных результатов процесса или эксперимента. Пусть будет правилом (пока не определено) для присвоения номера любому заданному результату ; пусть тоже будет. Тогда утверждает новое правило для назначения номера для любого заданного результата: добавить номер , который вы получите от следующих правил на номер , который вы получите от следующих правил .XωYS=X+YSXY

Мы можем остановиться там. Почему не следует будем называть суммой?S=X+Y

Если мы продолжим определить вероятностное пространство , масса (или плотность) функцию случайной величины (для это то, что наши правила являются теперь) можно получить сворачивая функцию массы (или плотности) с это (когда они независимы). Здесь «свертка» имеет свой обычный математический смысл . Но люди часто говорят о сверкающих распределениях, что безвредно; или иногда даже из свертки случайных величин, которые, по-видимому, нет - если он предлагает читать " " как " ", и, следовательно, что "S=X+YXYX+YX convoluted with Y+«в первом случае представляет собой сложную операцию, аналогичную или расширяющую идею добавления, а не простого и простого дополнения. Надеюсь, из вышеприведенного описания ясно, что мы остановились на том, что, как я сказал, мы можем, что уже имеет смысл прежде чем вероятность будет даже внесена в картину.X+Y

В математических терминах случайные величины - это функции, чья совместная область представляет собой набор действительных чисел, а чья область представляет собой набор всех результатов. Таким образом, " " в " " (или " ", чтобы явным образом показать свои аргументы) имеет то же значение, что и " " в " ". Хорошо подумать, как бы вы суммировали векторы реализованных ценностей, если это помогает интуиции; но это не должно вызывать путаницы в отношении обозначений, используемых для сумм самих случайных величин.+X+YX(ω)+Y(ω)+sin(θ)+cos(θ)


[Этот ответ просто пытается объединить краткие замечания, сделанные @MartijnWeterings, @IlmariKaronen, @RubenvanBergen, & @whuber в их ответах и ​​комментариях. Я подумал, что это может помочь понять, что такое случайная величина, а не свертка. Спасибо вам всем!]


(+1) Для усилий. Ответ слишком глубокий для меня, чтобы понять. Тем не менее, это привело меня к одному. Пожалуйста, прочитайте это и дайте мне знать ваши мысли.
Карл

Меня смущают эллиптические обозначения: для всех , другими словами, сложение векторов . Если бы кто-то сказал «векторное сложение», а не «сложение» , я бы не почесал голову, размышляя о том, что имелось в виду, но не сказал бы. Si=Xi+Yii=1,2,3,...,n1,n
Карл

Что ж, если вы поместите реализации & в векторы и захотите вычислить вектор реализаций , тогда вы будете использовать сложение векторов. Но это кажется довольно касательным. В конце концов, почувствуете ли вы необходимость объяснять « » с помощью векторов или сказать, что « » в этом выражении означает добавление вектора? XYSsin(θ)+cos(ϕ)+
Scortchi - Восстановить Монику

Сделать что? Контекстом были дискретные данные, например, RV, а не непрерывные функции, например, PDF или , а - обычная сумма. sin(θ)sin(θ)+cos(ϕ)
Карл

1
@Carl: (1) Если биолог моделирует, нет. яйца, откладываемые в гнезде утки как пуассоновский р-н, на самом деле не противодействуют возможности появления бесконечного количества яиц. Если у вас есть вопрос о роли бесконечных множеств в математике, задайте его по математике или философии SE. (2) Несмотря на то, что номенклатура вполне стандартна, она может ввести в заблуждение отсюда мой ответ.
Scortchi - Восстановить Монику

3

В ответ на ваше "Уведомление" ... нет.

Пусть , , и случайные величины , и пусть . Тогда, как только вы выбираете и , вы вынуждаете . Вы делаете эти два выбора, в этом порядке, когда пишете Но это свертка.XYZZ=X+YZXY=ZX

P(Z=z)=P(X=x)P(Y=zx)dx.

Уведомление прошло. (+1) вам за заботу.
Карл

2

Причина та же, что произведения степенных функций связаны со свертками. Свертка всегда выглядит естественно, если вы комбинируете с объектами, которые имеют диапазон (например, степени двух степенных функций или диапазон PDF-файлов) и где новый диапазон отображается как сумма исходных диапазонов.

Это легче всего увидеть для средних значений. Чтобы имел среднее значение, либо оба должны иметь средние значения, либо, если одно имеет высокое значение, другое должно иметь низкое значение, и наоборот. Это соответствует форме свертки, которая имеет один индекс, идущий от высоких значений к низким значениям, в то время как другой увеличивается.x+y

Если вы посмотрите на формулу для свертки (для дискретных значений, просто потому, что мне там легче увидеть)

(fg)(n)=kf(k)g(nk)

тогда вы видите, что сумма параметров функций ( и ) всегда равна точно . Таким образом, то, что фактически делает свертка, это суммирование всех возможных комбинаций, которые имеют одинаковое значение.nkkn

Для силовых функций получаем

(a0+a1x1+a2x2++anxn)(b0+b1x1+b2x2++bmxm)=i=0m+nkakbikxi

который имеет одинаковую комбинацию высокого показателя степени слева с низким показателем справа или наоборот, чтобы всегда получать одинаковую сумму.

Как только вы увидите, что в действительности здесь делает свертка, то есть какие термины объединяются и почему, следовательно, она должна появляться во многих местах, причина для свертывания случайных величин должна стать совершенно очевидной.


2

Докажем предположение для непрерывного случая, а затем объясним и проиллюстрируем его, используя гистограммы, построенные из случайных чисел, и суммы, образованные путем сложения упорядоченных пар чисел, так что дискретная свертка и обе случайные величины имеют длину .n

Из Гринстед CM, Снелл JL. Введение в вероятность: Американское математическое общество; 2012. Ch. 7, упражнение 1:

Пусть и - независимые вещественные случайные величины с функциями плотности и соответственно. Покажите, что функция плотности суммы является сверткой функций и .XYfX(x)fY(y)X+YfX(x)fY(y)

Пусть совместная случайная величина . Тогда объединенная функция плотности равна , поскольку и независимы. Теперь вычислите вероятность того, что , интегрируя функцию плотности соединения по соответствующей области на плоскости. Это дает интегральную функцию распределения .Z(X,Y)ZfX(x)fY(y)XYX+YzZ

FZ(z)=P(X+Yz)=(x,y):x+yzfX(x)fY(y)dydx
=fX(x)[yzxfY(y)dy]dx=fX(x)[FY(zx)]dx.

Теперь дифференцируем эту функцию по чтобы получить функцию плотности .zz

fZ(z)=dFZ(z)dz=fX(x)fY(zx)dx.

Чтобы оценить, что это означает на практике, это было проиллюстрировано на следующем примере. Реализация элемента случайного числа (статистика: результат, информатика: пример) из распределения может рассматриваться как получение обратной кумулятивной функции плотности функции плотности вероятности случайной вероятности. (Случайной вероятностью в вычислительном отношении является один элемент из равномерного распределения на интервале [0,1].) Это дает нам единственное значение на осиЗатем мы генерируем другой осевой второй случайный элемент из обратного CDF другого, возможно, другого, PDF второй, другой случайной вероятности. Тогда у нас есть два случайных элемента. Когда добавлено, дваxxx- сгенерированные таким образом значения становятся третьим элементом, и, обратите внимание, что произошло. Два элемента теперь становятся единым элементом величины , т. Е. Информация потеряна. Это контекст, в котором происходит «сложение»; это сложениеx1+x2x-значения. Когда имеет место многократное повторение этого типа сложения, результирующая плотность реализаций (итоговая плотность) сумм стремится к PDF свертки отдельных плотностей. Полная потеря информации приводит к сглаживанию (или дисперсии плотности) свертки (или сумм) по сравнению с составляющими PDF (или слагаемыми). Другой эффект - смещение местоположения свертки (или суммы). Обратите внимание, что реализации (результаты, экземпляры) нескольких элементов предоставляют только разреженные элементы, заполняющие (иллюстрирующие) непрерывное пространство выборки.

Например, 1000 случайных значений были созданы с использованием гамма-распределения с формой и шкалой . Они были добавлены попарно к 1000 случайным значениям из нормального распределения со средним значением 4 и стандартным отклонением . Гистограммы, измеренные по плотности для каждой из трех групп значений, были совмещены (левая панель внизу) и сопоставлены (правая панель внизу) с функциями плотности, используемыми для генерации случайных данных, а также со сверткой этих функций плотности. 10/921/4введите описание изображения здесь

Как видно на рисунке, добавление объяснения слагаемых представляется правдоподобным, поскольку сглаженные ядром распределения данных (красные) на левой панели аналогичны функциям непрерывной плотности и их свертке на правой панели.


@whuber Наконец, я думаю, что понимаю. Сумма случайных событий. Взгляните на мое объяснение и скажите, если теперь все ясно, пожалуйста.
Карл

3
Это помогает быть осторожным с языком. События являются сетами . Редко они даже наборы чисел (поэтому их элементы называются "результаты"). События не добавляют - значения случайных величин делают. Вопрос о «впечатляюще сложном» просто отвлекает. Действительно, если вы хотите понять суть вопроса, убедитесь, что одно из слагаемых в вашем примере является случайной величиной с нулевым средним, потому что среднее значение влияет на общий сдвиг в местоположении. Вы хотите интуитивно понять, что свертка делает иначе, чем смещение местоположения.
whuber

@whuber Спасибо-полезно. Только в статистике это результат одного элемента выборочного пространства. Для остальных из нас результат есть результат события. Сглаживание и сдвиг. То, что я показываю, является наименее запутанным примером многих, поскольку оно уменьшает столкновение наложенных графиков.
Карл

1
Теперь я понимаю, как вы думаете о смешанных моделях. Вы создаете то, что иногда называют «мультимножествами». (Обычно для уточнения обозначения используется конструктор, отличный от скобок .) Идея, по-видимому, заключается в эмпирической функции распределения: эмпирическое распределение мультимножества и эмпирическое распределение мультимножества дают возрастают до эмпирического распределения их мультимножественного объединения, представляющего собой смесь двух распределений с относительными весамии{,}AB|A||B|.
whuber

1
Я думаю, что я обнаружил потенциальный источник путаницы в этих текущих изменениях. Поскольку объяснение в комментарии заняло бы слишком много времени, я добавил к своему ответу правку в надежде, что это немного поможет. Действительно, первоначальная первая строка моего ответа на этот счет вводила в заблуждение, поэтому я тоже исправил ее с извинениями.
whuber

1

Этот вопрос может быть старым, но я хотел бы представить еще одну перспективу. Он основан на формуле для изменения переменной в совместной плотности вероятности. Его можно найти в Конспектах лекций: Вероятность и случайные процессы на KTH, 2017 Ed. (Koski, T., 2017, pp 67), что само по себе относится к подробному доказательству в Analysens Grunder, del 2 (Neymark, M., 1970, pp 148-168):


Пусть случайный вектор имеет объединенный pdf . Определить новый случайный вектор помощьюX=(X1,X2,...,Xm)fX(x1,x2,...,xm)Y=(Y1,Y2,...,Ym)

Yi=gi(X1,X2,...,Xm),i=1,2,...,m

где непрерывно дифференцируемо и обратимо с обратнымgi(g1,g2,...,gm)

Xi=hi(Y1,Y2,...,Ym),i=1,2,...,m

Тогда совместный pdf из (в области обратимости)Y

fY(y1,y2,...,ym)=fX(h1(x1,x2,...,xm),h2(x1,x2,...,xm),...,hm(x1,x2,...,xm))|J|

где - определитель якобианаJ

J=|x1y1x1y2...x1ymx2y1x2y2...x2ymxmy1xmy2...xmym|


Теперь, давайте применим эту формулу, чтобы получить объединенный pdf из суммы irvs :X1+X2

Определите случайный вектор с неизвестным совместным pdf . Затем определите случайный вектор помощьюX=(X1,X2)fX(x1,x2)Y=(Y1,Y2)

Y1=g1(X1,X2)=X1+X2Y2=g2(X1,X2)=X2.

Обратная карта тогда

X1=h1(Y1,Y2)=Y1Y2X2=h2(Y1,Y2)=Y2.

Таким образом, из - за этого и наше предположение , что и независимы, совместное ПДФ являетсяX1X2Y

fY(y1,y2)=fX(h1(y1,y2),h2(y1,y2))|J|=fX(y1y2,y2)|J|=fX1(y1y2)fX2(y2)|J|

где якобиан являетсяJ

J=|x1y1x1y2x2y1x2y2|=|1101|=1

Чтобы найти PDF , мы маргинализуемY1=X1+X2

fY1=fY(y1,y2)dy2=fX(h1(y1,y2),h2(y1,y2))|J|dy2=fX1(y1y2)fX2(y2)dy2

где мы находим твою свертку: D


0

Общие выражения для сумм n непрерывных случайных величин находятся здесь:

https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0216422

«Многоступенчатые модели отказа сложных систем, каскадных катастроф и возникновения болезней»

Для положительных случайных величин сумма может быть просто записана в терминах произведения преобразований Лапласа и обратного их произведения. Метод адаптирован из расчета, который появился в учебнике ET Jaynes «Теория вероятностей».


Добро пожаловать на наш сайт. Вы можете найти интересную ветку по адресу stats.stackexchange.com/questions/72479 , а также статью Moschopolous , на которую она ссылается.
whuber
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.