В главе 2 Матричной поваренной книги есть хороший обзор материала матричного исчисления, который дает много полезных тождеств, которые помогают решать проблемы, с которыми можно столкнуться при выполнении вероятности и статистики, включая правила, помогающие дифференцировать многомерную гауссовскую вероятность.
Если у вас есть случайный вектор который является многомерной нормалью со средним вектором и ковариационной матрицей , то используйте уравнение (86) в поваренной книге матрицы, чтобы найти градиент логарифмическая вероятность относительно равнаyμΣLμ
∂L∂μ=−12(∂(y−μ)′Σ−1(y−μ)∂μ)=−12(−2Σ−1(y−μ))=Σ−1(y−μ)
Я оставлю это вам, чтобы разграничить это снова и найти ответ: .−Σ−1
В качестве «дополнительного кредита» используйте уравнения (57) и (61), чтобы определить, что градиент по отношению к равенΣ
∂L∂Σ=−12(∂log(|Σ|)∂Σ+∂(y−μ)′Σ−1(y−μ)∂Σ)=−12(Σ−1−Σ−1(y−μ)(y−μ)′Σ−1)
Я пропустил много шагов, но я сделал этот вывод, используя только идентификаторы, найденные в матричной поваренной книге, поэтому я оставлю это вам, чтобы заполнить пробелы.
Я использовал эти уравнения для оценки максимального правдоподобия, поэтому я знаю, что они правильные :)