Какова максимальная оценка вероятности ковариации двумерных нормальных данных, когда известны среднее значение и дисперсия?


10

Предположим, у нас есть случайная выборка из двумерного нормального распределения, которая имеет нули в качестве средних значений и единицы в качестве дисперсий, поэтому единственным неизвестным параметром является ковариация. Что такое MLE ковариации? Я знаю, что это должно быть что-то вроде но откуда мы это знаем?1nj=1nxjyj


1
Для начала, разве вы не думаете, что немного глупо оценивать средние значения с помощью и когда на самом деле мы знаем, что они равны 0 и 0? x¯y¯
Вольфганг

Очень недоверчивый, исправил это. До сих пор не понимаю, как это может легко последовать. Это похоже на выборочную дисперсию, но почему это MLE (если это не так, и я сделал еще одну ошибку)
Стейси

Вы удалили ? Принятие этой формулы не означает, что вы рассматриваете и как оценки средних значений. 1ni=1n(xix¯)(yiy¯)x¯y¯
Стефан Лоран

@ StéphaneLaurent Да, в первом посте формула была дана так, как вы ее написали.
Вольфганг

Ответы:


11

Оценочный коэффициент для коэффициента корреляции (который в случае двумерного стандартного нормаля равен ковариации)

r~=1ni=1nxiyi

метод оценки моментов, ковариация образца. Давайте посмотрим, совпадает ли это с оценкой максимального правдоподобия, .ρ^

Совместная плотность стандартного двухмерного нормальна коэффициент корреляции İŞρ

f(x,y)=12π1ρ2exp{x2+y22ρxy2(1ρ2)}

и таким образом, логарифмическая функция правдоподобия из н.о.р. выборки размера являетсяn

lnL=nln(2π)n2ln(1ρ2)12(1ρ2)i=1n(xi2+yi22ρxiyi)

(здесь предположение iid, конечно же, относится к каждому тиражу из двумерной популяции)

Взяв производную по и установив ее равной нулю, получим полином 3d-степени по :ρρ

ρ^:nρ^3(i=1nxiyi)ρ^2(11ni=1n(xi2+yi2))nρ^i=1nxiyi=0

То , что вычисления правильны можно проверить , если один имеет ожидаемое значение производной оценивается в истинном коэффициенте -это будет равен нуль.ρ

Для компактности, записи , который является суммой образца дисперсии и . Если мы разделим выражение 1-й производной на , появится оценка MoM, а именно(1/n)i=1n(xi2+yi2)=(1/n)S2XYn

ρ^:ρ^3r~ρ^2+[(1/n)S21]ρ^r~=0

ρ^(ρ^2r~ρ^+[(1/n)S21])=r~

Делая алгебру, нетрудно заключить, что мы получим тогда и только тогда, когда , т.е. только если так получится, что сумма выборочных дисперсий равна сумма истинных отклонений. Так в общем (1/п)S2=2ρ^=r~(1/n)S2=2

ρ^r~

Так что здесь происходит? Кто-нибудь умнее объяснит это, на данный момент давайте попробуем симуляцию: я сгенерировал iid выборку из двух стандартных нормалей с коэффициентом корреляции . Размер выборки был . Значения выборки былиn = 1000ρ=0.6n=1.000

i=1nxiyi=522.05,S2=1913.28

Метод Метода Моментов дает нам

r~=522.051000=0.522

Что происходит с логарифмической вероятностью? Визуально у нас есть

введите описание изображения здесь

Численно мы имеем

ρ1st derivlnL0.570.92783.650.5159.41782.470.5247.7781.480.5335.78780.680.5423.64780.10.5511.29779.750.561.29779.640.5714.1779.810.5827.15780.270.5940.44781.050.653.98782.18

и мы видим, что логарифмическое правдоподобие имеет максимум a tad до где также 1-я производная становится равной нулю . Никаких сюрпризов для значений не показано. Также 1-я производная не имеет другого корня.ρ=0.56(ρ^=0.558985)ρ

Таким образом, это моделирование согласуется с результатом, что оценка максимального правдоподобия не равна методу оценки моментов (который является выборочной ковариацией между двумя rv).

Но похоже, что «все» говорят, что это должно … так что кто-то должен придумать объяснение.

ОБНОВИТЬ

Ссылка, которая доказывает, что MLE является оценкой Метода Моментов: Anderson, TW, & Olkin, I. (1985). Оценка максимального правдоподобия параметров многомерного нормального распределения. Линейная алгебра и ее приложения, 70, 147-171.
Имеет ли значение, что здесь все средства и различия могут свободно изменяться и не фиксироваться?

... Вероятно, да, потому что комментарий @ guy в другом (теперь удаленном) ответе говорит о том, что при заданных параметрах среднего и дисперсии двумерная нормаль становится членом изогнутого экспоненциального семейства (и поэтому некоторые результаты и свойства изменяются) ... который кажется единственным способом, который может согласовать два результата.


1
Это немного удивительно, но после некоторых размышлений этого следовало ожидать. Проблему можно перефразировать как оценку коэффициента регрессии в модели где . Это не линейная модель, поэтому нет оснований ожидать, что MLE будет простым точечным произведением. Та же логика показывает (я думаю!) , Что если мы знаем только , то ОМП является и если мы знаем только . Если мы не знаем ни того, ни другого, мы получаем оценку вашего MOM. ρY=ρX+ϵϵN(0,1ρ22)Var(X)xy/xxxy/yyVar(Y)
парень

1
@ Гай: Очень интересно. Я думаю, что эти аргументы, если их немного расширить, вполне заслуживают публикации в качестве отдельного ответа!
амеба

@ парень, я не думаю, что эта формулировка эквивалентна, потому что логарифмическая правдоподобие в настройке регрессии содержит квадрат . Коэффициент связанный с отсутствует в формулировке двумерной плотности. ϵ2=(yρx)2=y22ρxy+ρ2x2ρ2x2
Алекос Пападопулос

Я предполагаю, что . Представьте, что и , тогда ожидается оценка . 1ni=1n(xix¯)(yiy¯)n=2y1=y20
Стефан Лоран

1
@AlecosPapadopoulos . Термин отменяется знаменателем , поэтому единственный термин из данных, который вносит свой вклад в исходное логарифмическое правдоподобие: . Но это также непосредственно из хорошо известной факторизации , . Другие мои утверждения неверны, поскольку я не включил в них термин . x2+y22ρxy=(1ρ2)x2+(yρx)2(1ρ2)x2(1ρ2)(yρx)2/(1ρ2)XN(μX,σX2)[Y|X]N(μY+ρXσYσX(XμX),σY|X21ρ22)σY/σX
парень

2

При указанных условиях ( и ) функция правдоподобия для случайной выборки размера равнаμX=μY=0σX=σY=1n

L(ρ|X,Y)=1(2π[1ρ2])n/2exp[12(1ρ2)(XX2ρXY+YY)].

Теперь найдите логарифмическую вероятность и возьмите производную по . Затем установите его равным 0, решая для . Конечно, вы должны сделать какой-то соответствующий тест, чтобы показать, что вы нашли на самом деле глобальный максимум.ρρ^

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.