Интуиция (геометрическая или другая) из


18

Рассмотрим элементарную идентичность дисперсии:

Var(X)=E[(XE[X])2]=...=E[X2](E[X])2

Это простая алгебраическая манипуляция с определением центрального момента в нецентральные моменты.

Это позволяет удобно манипулировать в других контекстах. Это также позволяет вычислить дисперсию с помощью одного прохода данных, а не двух проходов, сначала для вычисления среднего значения, а затем для вычисления дисперсии.Var(X)

Но что это значит ? Для меня не существует непосредственной геометрической интуиции, которая связывает разброс по среднему значению с разбросом около 0. Поскольку является набором для одного измерения, как вы рассматриваете разброс вокруг среднего как разницу между разбросом вокруг начала координат и квадратом жадный?X

Существуют ли какие-либо хорошие интерпретации линейной алгебры или физические интерпретации или иные, которые могли бы дать представление об этой идентичности?


7
Подсказка: это теорема Пифагора.
whuber

1
@ Матфея Интересно, что означает " ". Я подозреваю, что это не ожидание, а просто сокращение от среднего арифметического. В противном случае уравнения были бы неправильными (и почти бессмысленными, поскольку они тогда приравнивали бы случайные переменные к числам). E
whuber

2
@whuber Поскольку внутренние произведения вводят идею расстояний и углов, а внутреннее произведение векторного пространства вещественных случайных величин определяется как (?), мне интересно, можно ли дать некоторую геометрическую интуицию через неравенство треугольника. Я понятия не имею, как поступить, но мне было интересно, имеет ли это смысл. E[XY]
Антони Пареллада

1
@Antoni Неравенство треугольника слишком общее. Внутренний продукт - это гораздо более особенный объект. К счастью, подходящая геометрическая интуиция в точности соответствует евклидовой геометрии. Более того, даже в случае случайных величин и необходимая геометрия может быть ограничена двумерным вещественным векторным пространством, порожденным и то есть самой евклидовой плоскостью. В данном случае не является RV: это просто вектор. Здесь пространство, охватываемое и является евклидовой плоскостью, в которой происходит вся геометрия. YXYY X n X ( 1 , 1 , , 1 )XYXnX(1,1,,1)
whuber

3
Установка в ответе, на который я , и деление всех терминов на (если вы хотите) даст вам полное алгебраическое решение для дисперсии: нет причин для повторного копирования. Это потому, что - среднее арифметическое , откуда - это просто кратная дисперсия, как вы ее здесь определили, - раз среднее арифметическое в квадрате, а в раз превышает среднее арифметическое значений в квадрате. п β 0у| | у - у | | 2н| | у | | 2н| | у| | 2нβ^1=0nβ^0y||yy^||2n||y^||2n||y||2n
whuber

Ответы:


21

Расширяя точку @ whuber в комментариях, если и ортогональны, у вас есть теорема Пифагора :ZYZ

Y2+Z2=Y+Z2

Заметьте, что является допустимым внутренним произведением и что - норма, индуцированная этим внутренним произведением .| | Y | | = Y,ZE[YZ]Y=E[Y2]

Пусть некоторая случайная величина. Пусть , Пусть . Если и ортогональны:Y = E [ X ] Z = X - E [ X ] Y ZXY=E[X]Z=XE[X]YZ

Y2+Z2=Y+Z2E[E[X]2]+E[(XE[X])2]=E[X2]E[X]2+Var[X]=E[X2]

И это легко показать , что и являются ортогональными при этом внутреннем продукте:Z = X - E [ X ]Y=E[X]Z=XE[X]

Y,Z=E[E[X](XE[X])]=E[X]2E[X]2=0

Одна из ножек треугольника , другая нога , а гипотенуза . И теорема Пифагора может быть применена, потому что униженная случайная величина ортогональна ее среднему значению.E [ X ] XXE[X]E[X]X


Техническое замечание:

Y = E [ X ] 1 E [ X ] 1 1 = [ 1 , 1 , 1 , , 1 ] Y X 1Y в этом примере действительно должно быть вектором , то есть скалярным умноженным на постоянный вектор (например, в случае дискретного конечного результата). представляет собой вектор проекции из на постоянный вектор .Y=E[X]1E[X]11=[1,1,1,,1]YX1

Простой пример

Рассмотрим случай, когда - случайная величина Бернулли, где . У нас есть:p = .2Xp=.2

X=[10]P=[.2.8]E[X]=iPiXi=.2

Y=E[X]1=[.2.2]Z=XE[X]=[.8.2]

И картина такая: введите описание изображения здесь

Квадратная величина красного вектора - это дисперсия , квадратная величина голубого вектора - , а квадратная величина желтого вектора - .E [ X ] 2 E [ X 2 ]XE[X]2E[X2]

ПОМНИТЕ, что эти величины, ортогональность и т. Д. не с обычным точечным произведением а с внутренним произведением . Величина желтого вектора не 1, а 0,2.Σ я P я Y я Z IiYiZiiPiYiZi

Красный вектор и синий вектор перпендикулярны внутреннему произведению но они не перпендикулярны во вступлении, смысл геометрии средней школы. Помните, что мы не используем обычный скалярный продукт в качестве внутреннего продукта!Z = Х - Е [ Х ] Σ я P я Y я Z я Σ я Y я Z яY=E[X]Z=XE[X]iPiYiZiiYiZi


Это действительно хорошо!
Антони Пареллада

1
Хороший ответ (+1), но ему не хватает цифры, а также может немного запутать OP, потому что ваш Z - это их X ...
говорит амеба Reinstate Monica

@ MatthewGunn, отличный ответ. Вы можете проверить мой ответ ниже для представления, где ортогональность в евклидовом смысле.
YBE

Я ненавижу быть тупым, но у меня проблемы с поддержанием , и направления логики прямо («потому что» приходит в места, которые не имеют смысла для меня). Такое ощущение, что многие (хорошо обоснованные) факты изложены случайным образом. В каком пространстве находится внутренний продукт? Почему 1 ? V a r ( X )ZVar(X)
Митч

@Mitch Логический порядок: (1) Обратите внимание, что вероятностное пространство определяет векторное пространство; мы можем рассматривать случайные величины как векторы. (2) Определите внутреннее произведение случайных величин и как . Во внутреннем пространстве произведений векторы и определяются как ортогональные, если их внутреннее произведение равно нулю. (3а) Пусть - некоторая случайная величина. (3б) Пусть и . (4) Заметим, что и определенные таким образом, ортогональны. (5) Так как иZ E [ Y Z ] Y Z X Y = E [ X ] Z = X - E [ X ] Y ZYZE[YZ]YZXY=E[X]Z=XE[X]YZZYZявляются ортогональными, применяется теорема Пифагора (6) По простой алгебре теорема Пифагора эквивалентна тождеству.
Мэтью Ганн

7

Я пойду на чисто геометрический подход для очень специфического сценария. Рассмотрим дискретную случайную величину принимающую значения с вероятностями . Далее мы будем предполагать, что эта случайная величина может быть представлена ​​в в виде вектора, . { x 1 , x 2 } ( p 1 , p 2 ) R 2 X = ( x 1 X{x1,x2}(p1,p2)R2X=(x1p1,x2p2)введите описание изображения здесь

Обратите внимание, что квадрат длины в равен что равно . Таким образом, .x 2 1 p 1 + x 2 2 p 2 E [ X 2 ] X = Xx12p1+x22p2E[X2]X=E[X2]

Поскольку , вершина вектора фактически отслеживает эллипс. Это становится легче увидеть, если репараметризовать и как и . Следовательно, мы имеем и .X p 1 p 2 cos 2 ( θ ) sin 2 ( θ ) p1+p2=1Xp1p2cos2(θ)sin2(θ)p1=cos(θ)p2=sin(θ)

Один из способов рисования эллипсов - это механизм под названием Траммель Архимеда . Как описано в вики: он состоит из двух челноков, которые ограничены («растоптаны») перпендикулярными каналами или рельсами, и стержня, который прикреплен к челнокам с помощью шарниров в фиксированных положениях вдоль стержня. Когда шаттлы движутся взад и вперед, каждый по своему каналу, конец стержня движется по эллиптической траектории. Этот принцип иллюстрируется на рисунке ниже.

Теперь давайте геометрически проанализируем один случай этой путаницы, когда вертикальный челнок находится в точке а горизонтальный челнок находится в точке образуя угол . Из-за конструкции, и , (здесь предполагается wlog).B θ | B X | = х 2 | A B | = Х 1 - х 2 ∀ & thetas ; х 1х 2ABθ|BX|=x2|AB|=x1x2θx1x2

введите описание изображения здесь

Давайте нарисуем линию от начала координат, , которая перпендикулярна стержню. Можно показать, что . Для этой конкретной случайной величины Следовательно, перпендикулярное расстояниеот начала координат до стержня фактически равно стандартному отклонению .| O C | = ( x 1 - x 2 ) sin ( θ ) cos ( θ ) V a r ( X )OC|OC|=(x1x2)sin(θ)cos(θ)| OC| σ

Var(X)=(x12p1+x22p2)(x1p1+x2p2)2=x12p1+x22p2x12p12x22p222x1x2p1p2=x12(p1p12)+x22(p2p22)2x1x2p1p2=p1p2(x122x1x2+x22)=[(x1x2)p1p2]2=|OC|2
|OC|σ

Если мы вычислим длину сегмента от до : Х | С Х |CX

|CX|=x2+(x1x2)cos2(θ)=x1cos2(θ)+x2sin2(θ)=x1p1+x2p2=E[X]

Применяя теорему Пифагора в треугольнике OCX, мы получаем

E[X2]=Var(X)+E[X]2.

Подводя итог , можно сказать, что для запятой, описывающей все возможные дискретные случайные величины, принимающие значения , - это расстояние от начала координат до вершины механизма и стандартное отклонение - перпендикулярное расстояние до стержня.{x1,x2} σE[X2]σ

Примечание : обратите внимание, что когда равно или , является полностью детерминированным. Когда равно мы получаем максимальную дисперсию.0 π / 2 X θ π / 4θ0π/2Xθπ/4


1
+1 Хороший ответ. А умножение векторов на квадрат вероятностей - это крутой / полезный трюк, чтобы обычное вероятностное понятие ортогональности выглядело ортогональным!
Мэтью Ганн

Отличная графика. Символы все имеет смысл (штангенциркуль , описывающий эллипс , а затем применяет Пифагор THM) , но почему - то я не получаю интуитивно , как это дает представление о том , как «волшебно» это касается моментов (распространения и в центре.
Митч

Рассмотрим путаницу как процесс, который определяет все возможные значимые случайные величины. Когда стержень горизонтальный или вертикальный, у вас есть детерминированный RV. В середине есть случайность, и оказывается, что в моей предложенной геометрической структуре насколько случайным является RV (его стандарт), точно измеряется расстоянием от стержня до начала координат. Здесь могут быть более глубокие отношения, так как эллиптические кривые соединяют различные объекты в математике, но я не математик, поэтому я не могу реально увидеть эту связь. (x1,x2)
YBE

3

Вы можете изменить порядок следующим образом:

Var(X)=E[X2](E[X])2E[X2]=(E[X])2+Var(X)

Затем интерпретируйте следующим образом: ожидаемый квадрат случайной величины равен квадрату ее среднего плюс ожидаемое квадратическое отклонение от среднего.


Ой. Да. Просто. Но квадраты все еще кажутся немного не интерпретированными. Я имею в виду, что это имеет смысл (в некотором роде, очень свободно) без квадратов.
Митч

3
Я не продан на этом.
Майкл Р. Черник

1
Если применима теорема Пифагора, каков треугольник с какими сторонами и как две стороны перпендикулярны?
Митч

1

Приносим извинения за то, что не обладаем навыком для разработки и предоставления правильного ответа, но я думаю, что ответ заключается в концепции моментов физической классической механики, особенно в преобразовании между 0 центрированными «необработанными» моментами и среднецентрированными центральными моментами. Помните, что дисперсия - это центральный момент второго порядка случайной величины.


1

Общая интуиция заключается в том, что вы можете связать эти моменты, используя теорему Пифагора (PT) в надлежащим образом определенном векторном пространстве, показав, что два из этих моментов перпендикулярны, а третий является гипотенузой. Единственная необходимая алгебра - показать, что две ноги действительно ортогональны.

Ради следующего я предполагаю, что вы имели в виду типовые средние и дисперсии для целей вычисления, а не моменты для полных распределений. То есть:

E[X]=1nxi,mean,first central sample momentE[X2]=1nxi2,second sample moment (noncentral)Var(X)=1n(xiE[X])2,variance,second central sample moment

(где все суммы по пунктам).n

Для справки, элементарное доказательство - просто нажатие символов: Var(X)=E[X2]E[X]2

Var(X)=1n(xiE[X])2=1n(xi22E[X]xi+E[X]2)=1nxi22nE[X]xi+1nE[X]2=E[X2]2E[X]2+1nnE[X]2=E[X2]E[X]2

Здесь мало смысла, просто элементарное манипулирование алгеброй. Можно заметить, что является константой внутри суммирования, но это все.E[X]

Теперь в векторном пространстве / геометрической интерпретации / интуиции мы покажем слегка перестроенное уравнение, соответствующее PT, которое

Var(X)+E[X]2=E[X2]

Итак, рассмотрим , образец из элементов, как вектор из . И давайте создадим два вектора и .XnRnE[X]1XE[X]1

Вектор имеет среднее значение выборки, как и каждая из его координат.E[X]1

Вектор является .XE[X]1x1E[X],,xnE[X]

Эти два вектора перпендикулярны, поскольку скалярное произведение двух векторов оказывается равным 0:

E[X]1(XE[X]1)=E[X](xiE[X])=(E[X]xiE[X]2)=E[X]xiE[X]2=nE[X]E[X]nE[X]2=0

Таким образом, два вектора перпендикулярны, что означает, что они являются двумя ветвями прямоугольного треугольника.

Тогда по PT (который имеет место в ), сумма квадратов длин двух ветвей равна квадрату гипотенузы.Rn

По той же алгебре, что и в скучном алгебраическом доказательстве сверху, мы показали, что получаем, что является квадратом вектора гипотенузы:E[X2]

(Икс-Е[Икс])2+Е[Икс]2знак равно,,,знак равноЕ[Икс2] где возведение в квадрат - это скалярное произведение (и это действительно и - это .Е[Икс]1(Икс-Е[Икс])2Вaр(Икс)

Интересной частью этой интерпретации является преобразование из выборки из элементов из одномерного распределения в векторное пространство из измерений. Это похоже на двумерных выборок, интерпретируемых как действительно две выборки по переменным.NNNN

В одном смысле этого достаточно, прямоугольный треугольник из векторов и появляется как гипотенуза. Мы дали интерпретацию (векторы) для этих значений и показали, что они соответствуют. Это достаточно круто, но не просвещает ни статистически, ни геометрически. На самом деле это не говорит, почему, и было бы много дополнительных концептуальных механизмов, чтобы, в конце концов, в основном воспроизвести чисто алгебраическое доказательство, которое мы уже имели в начале.Е[Икс2]

Другая интересная часть заключается в том, что среднее значение и дисперсия, хотя они интуитивно измеряют центр и разброс в одном измерении, являются ортогональными в измерениях. Что это значит, что они ортогональны? Я не знаю! Есть ли другие моменты, которые являются ортогональными? Существует ли более широкая система отношений, которая включает эту ортогональность? центральные моменты против нецентральных моментов? Я не знаю!N


Я также заинтересован в интерпретации / интуиции, лежащей в основе внешне подобного уравнения компромисса дисперсии смещения. У кого-нибудь есть намеки там?
Митч

Пусть - вероятность возникновения состояния . Если то , то есть - это просто произведение точек между и деленное на , Если , то, что я использовал как внутренний продукт ( ), в основном является точечным произведением, на . Вся эта пифагорейская интерпретация все еще нуждается в том, чтобы вы использовали конкретное внутреннее произведение (хотя оно алгебраически близко к классическому точечному произведению для вероятностной мерыпяяпязнак равно1NΣяпяИксяYязнак равно1NΣяИксяYяЕ[ИксY]ИксYNяпязнак равно1NЕ[ИксY]знак равноΣяпяИксяYяNЕ[ИксY]птакой, что ). япязнак равно1N
Мэтью Ганн

Кстати, хитрость, которую сделал @YBE, заключалась в том, чтобы определить новые векторы и , чтобы и . Затем укажите произведение . Точечное произведение и соответствует (это то, что я использовал как внутренний продукт). у й я=хяИкс^Y^у я=хяИкс^язнак равноИксяпях у =ΣяхяY^язнак равноИксяпя х у Е[ху]Икс^Y^знак равноΣяИксяпяYяпязнак равноΣяпяИксяYязнак равноЕ[ИксY]Икс^Y^Е[ИксY]
Мэтью Ганн
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.