Оценочный коэффициент для коэффициента корреляции (который в случае двумерного стандартного нормаля равен ковариации)
r~=1n∑i=1nxiyi
метод оценки моментов, ковариация образца. Давайте посмотрим, совпадает ли это с оценкой максимального правдоподобия, .ρ^
Совместная плотность стандартного двухмерного нормальна коэффициент корреляции İŞρ
f(x,y)=12π1−ρ2−−−−−√exp{−x2+y2−2ρxy2(1−ρ2)}
и таким образом, логарифмическая функция правдоподобия из н.о.р. выборки размера являетсяn
lnL=−nln(2π)−n2ln(1−ρ2)−12(1−ρ2)∑i=1n(x2i+y2i−2ρxiyi)
(здесь предположение iid, конечно же, относится к каждому тиражу из двумерной популяции)
Взяв производную по и установив ее равной нулю, получим полином 3d-степени по :ρρ
ρ^:nρ^3−(∑i=1nxiyi)ρ^2−(1−1n∑i=1n(x2i+y2i))nρ^−∑i=1nxiyi=0
То , что вычисления правильны можно проверить , если один имеет ожидаемое значение производной оценивается в истинном коэффициенте -это будет равен нуль.ρ
Для компактности, записи , который является суммой образца дисперсии и . Если мы разделим выражение 1-й производной на , появится оценка MoM, а именно(1/n)∑ni=1(x2i+y2i)=(1/n)S2XYn
ρ^:ρ^3−r~ρ^2+[(1/n)S2−1]ρ^−r~=0
⇒ρ^(ρ^2−r~ρ^+[(1/n)S2−1])=r~
Делая алгебру, нетрудно заключить, что мы получим тогда и только тогда, когда , т.е. только если так получится, что сумма выборочных дисперсий равна сумма истинных отклонений. Так в общем (1/п)S2=2ρ^=r~(1/n)S2=2
ρ^≠r~
Так что здесь происходит? Кто-нибудь умнее объяснит это, на данный момент давайте попробуем симуляцию: я сгенерировал iid выборку из двух стандартных нормалей с коэффициентом корреляции . Размер выборки был . Значения выборки былиn = 1000ρ=0.6n=1.000
∑i=1nxiyi=522.05,S2=1913.28
Метод Метода Моментов дает нам
r~=522.051000=0.522
Что происходит с логарифмической вероятностью? Визуально у нас есть
Численно мы имеем
ρ0.50.510.520.530.540.550.560.570.580.590.61st deriv−70.92−59.41−47.7−35.78−23.64−11.291.2914.127.1540.4453.98lnL−783.65−782.47−781.48−780.68−780.1−779.75−779.64−779.81−780.27−781.05−782.18
и мы видим, что логарифмическое правдоподобие имеет максимум a tad до где также 1-я производная становится равной нулю . Никаких сюрпризов для значений не показано. Также 1-я производная не имеет другого корня.ρ=0.56(ρ^=0.558985)ρ
Таким образом, это моделирование согласуется с результатом, что оценка максимального правдоподобия не равна методу оценки моментов (который является выборочной ковариацией между двумя rv).
Но похоже, что «все» говорят, что это должно … так что кто-то должен придумать объяснение.
ОБНОВИТЬ
Ссылка, которая доказывает, что MLE является оценкой Метода Моментов: Anderson, TW, & Olkin, I. (1985). Оценка максимального правдоподобия параметров многомерного нормального распределения. Линейная алгебра и ее приложения, 70, 147-171.
Имеет ли значение, что здесь все средства и различия могут свободно изменяться и не фиксироваться?
... Вероятно, да, потому что комментарий @ guy в другом (теперь удаленном) ответе говорит о том, что при заданных параметрах среднего и дисперсии двумерная нормаль становится членом изогнутого экспоненциального семейства (и поэтому некоторые результаты и свойства изменяются) ... который кажется единственным способом, который может согласовать два результата.