Интуитивное объяснение плотности преобразованной переменной?


37

Предположим, что X - случайная величина с pdf fX(x) . Тогда случайная величина Y=X2 имеет pdf

fY(y)={12y(fX(y)+fX(y))y00y<0

Я понимаю исчисление за этим. Но я пытаюсь найти способ объяснить это кому-то, кто не знает исчисления. В частности, я пытаюсь объяснить, почему фактор 1y появляется спереди. Я возьму удар на это:

Предположим, что X имеет гауссово распределение. Почти весь вес его PDF находится между значениями, скажем, 3 и 3. Но что карты до 0 до 9 для Y . Таким образом, тяжелый вес в формате PDF для X был расширен в более широком диапазоне значений в переходе к Y . Таким образом, чтобы fY(y) был истинным pdf, дополнительный тяжелый вес должен быть уменьшен с помощью мультипликативного коэффициента 1y

Как это звучит?

Если кто-то может дать лучшее объяснение своего или ссылку на него в документе или учебнике, я был бы очень признателен. Я нахожу этот пример преобразования переменной в нескольких книгах по математической вероятности / статистике. Но я никогда не найду интуитивного объяснения с этим :(


Я думаю, что ваше объяснение правильно.
highBandWidth

2
Объяснение верное, но оно чисто качественное: точная форма мультипликативного фактора все еще остается загадкой. Сила -1/2 просто появляется волшебно. Таким образом, на каком-то уровне вы должны сделать то же самое, что и в Calculus: найти скорость изменения функции квадратного корня.
whuber

Ответы:


37

PDF - это высота, но они используются для представления вероятности посредством площади. Поэтому это помогает выразить PDF таким образом, который напоминает нам, что площадь равна высоте, умноженной на основание.

Первоначально высота при любом значении x задается в PDF fX(x) . Основой является бесконечно малый сегмент dx , откуда распределение (то есть мера вероятности в отличие от функции распределения ) действительно является дифференциальной формой, или «элементом вероятности».

PEX(x)=fX(x)dx.

Это, а не PDF, это объект, с которым вы хотите работать как концептуально, так и практически, потому что он явно включает в себя все элементы, необходимые для выражения вероятности.

Когда мы повторно выражаем x через y=x2 , базовые сегменты dx растягиваются (или сжимаются): возводя в квадрат оба конца интервала от x до x+dx мы видим, что основание области y должно быть интервалом длины

dy=(x+dx)2x2=2xdx+(dx)2.

Поскольку произведение двух бесконечно малых величин ничтожно по сравнению с самими бесконечно малыми, мы заключаем

dy=2xdx, whence dx=dy2x=dy2y.

Установив это, вычисление является тривиальным, потому что мы просто подключаем новую высоту и новую ширину:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Поскольку основание, с точки зрения y , равно dy , все, что умножается, должно быть высотой, которую мы можем прочитать непосредственно из среднего слагаемого как

12yfX(y)=fY(y).

Это уравнение PEX(x)=PEY(y) фактически является законом сохранения площади (= вероятности).

Два файла PDF

На этом рисунке точно показаны узкие (почти бесконечно малые) фрагменты двух PDF-файлов, связанных с y=x2 . Вероятности представлены заштрихованными областями. Из-за сжатия интервала [0.32,0.45] посредством возведения в квадрат высоту красной области ( y , слева) необходимо пропорционально увеличить, чтобы она соответствовала области синей области ( x , справа).


2
Я люблю бесконечно малые. Это прекрасное объяснение. Мышление в терминах , которое ясно видно из производной преобразования, гораздо более интуитивно, чем мышление в терминах 2x . Я думаю, что именно здесь я и столкнулся. y
lowndrul

@whuber, я считаю, что первая строка должна быть ? Это то, что вы подразумеваете под pdf X ( x ) ? PS: также любопытно ваши мысли о моем ответе (ниже). P(X(x,x+dx))=fx(x)dxpdfX(x)
Карлос Синелли

@Carlos Это немного более строгий , чтобы выразить мысль в том , как я сделал в самом начале: Ф является то , что вы многократно мера Лебега по для того , чтобы получить заданную вероятностную меру. dx
whuber

@whuber, но если pdf - это то, что вы умножаете, то это термин , а не произведение f x ( x ) d x, как вы написали, верно? Непонятно, почему вы называете произведение f X ( x ) d x pdf. fX(x)fx(x)dxfX(x)dx
Карлос Синелли

1
@Carlos: спасибо; теперь я вижу вашу точку зрения. Я сделал несколько правок для решения этой проблемы.
whuber

11

Как насчет того, чтобы изготовить объекты, которые всегда квадратные, и я знаю распределение сторон по длине квадратов; Что я могу сказать о распределении площадей по площадям?

В частности, если я знаю распределение случайной величины , что я могу сказать о Y = X 2 ? Одна вещь, которую вы можете сказать, этоXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Таким образом, устанавливается связь между CDF и CDF X ; Какая связь между их PDF-файлами? Нам нужно исчисление для этого. Взятие производных обеих сторон дает вам результаты, которые вы хотели.YX


2
fY

1
Я не понимаю, почему pdf (x) = f (x) dx. Как насчет pdf (x) dx = f (x), density = prob mass/interval... что я не так делаю?
Фернандо

2

YP(Y(y,y+Δy))Y(y,y+Δy)Δy

XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Хорошо, теперь давайте перейдем к плотности. Во-первых, нам нужно определить, что такое плотность вероятности . Как следует из названия, это доля людей на площадь . То есть мы подсчитываем долю людей в этом контейнере и делим на размер корзины . Поскольку мы установили, что пропорции людей здесь одинаковы, но размеры бункеров изменились, мы заключаем, что плотность будет другой. Но отличается на сколько?

YfY(y):=P(Y(y,y+Δy))ΔyXfX(x):=P(X(x,x+Δx))Δx

Исходя из нашего предыдущего результата, что население в каждой корзине одинаково, мы имеем это,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.