Метод MLE может применяться в тех случаях, когда кто-то знает базовую функциональную форму pdf (например, гауссовскую, логарифмическую, экспоненциальную или любую другую), но не базовые параметры; например, они не знают значений и в pdf: или любой другой тип PDF, который они принимают. Задача метода MLE состоит в том, чтобы выбрать лучшие (то есть наиболее вероятные) значения для неизвестных параметров, учитывая конкретные измерения данных которые фактически наблюдались , Поэтому, чтобы ответить на ваш первый вопрос, да, вы всегда можете спросить кого-нибудь, чтоμσ
е( x | μ , σ) = 12 πσ2----√ехр[ - ( x - μ )22 σ2]
Икс1, х2, х3, . , ,форма pdf, которую они принимают для оценки максимального правдоподобия; на самом деле, оценочные значения параметров, которые они вам сообщают, даже не имеют смысла, если только они не передают этот контекст.
Алгоритм EM, как я видел его в прошлом, больше похож на мета-алгоритм, где некоторые метаданные отсутствуют, и вы должны оценить это также. Так, например, возможно, у меня есть PDF, который представляет собой смесь нескольких гауссиан, например: Внешне, за исключением добавление параметра амплитуды , это очень похоже на предыдущую задачу, но что если я скажу вам, что мы также даже не знаем значение (т. е. количество мод в гауссовой смеси) и мы хотим оценить это по данным измерений
е( х | А1, . , , ,N, μ1, . , , , μN, σ1, . , , σN) = ∑к = 1NAК2 πσ2К----√ехр[ - ( x - μК)22 σ2К]
AКNИкс1, х2, х3, . , , тоже?
В этом случае у вас есть проблема, потому что каждое возможное значение (это «мета» часть, на которую я ссылался выше) действительно в некотором смысле генерирует другую модель. Если , то у вас есть модель с тремя параметрами ( , , ), тогда как если , то у вас есть модель с шестью параметрами ( , , , , , ). Наилучшие значения, которые вы получите для ( , , ) вNN=1A1μ1σ1N=2A1A2μ1μ2σ1σ2A1μ1σ1N=1Модель нельзя напрямую сравнивать со значениями наилучшего соответствия, которые вы получаете для тех же параметров в модели , потому что это разные модели с разным числом степеней свободы .N=2
Роль алгоритма EM является создание механизма для создания этих типов сравнений ( как правило , путем наложения «сложности штрафа» , который предпочитает меньшие значения ) , так что мы можем выбрать лучшее общее значение для .NN
Итак, чтобы ответить на ваш оригинальный вопрос, алгоритм EM требует менее точной спецификации формы PDF; Можно сказать, что он рассматривает ряд альтернативных опций (например, опцию, где , , и т. д.), но все же требует, чтобы вы указали что-то об основной математической форме этих опций: вам все еще нужно указать «семейство» возможных PDF-файлов, в некотором смысле, даже если вы позволяете алгоритму решать за вас, какой «член» семейства обеспечивает наилучшее соответствие данным.N=1N=2N=3