В книге Бишопа по PRML он говорит, что переоснащение - это проблема с оценкой максимального правдоподобия (MLE), и байесовский может ее избежать.
Но я думаю, что переоснащение - это проблема скорее выбора модели, а не метода, используемого для оценки параметров. То есть, предположим, что у меня есть набор данных , который генерируется через , теперь я мог бы выбрать другие модели чтобы соответствовать данным, и выяснить, Какой из них лучше. И рассматриваемые модели являются полиномиальными с разными порядками, - это порядок 1, - это порядок 2, - это порядок 9.
Теперь я пытаюсь согласовать данные с каждой из 3 моделей, каждая модель имеет свои параметры, обозначенные как для .
Используя ML, у меня будет точечная оценка параметров модели , а слишком прост и всегда будет соответствовать данным, тогда как слишком сложен и будет соответствовать данным, только будет хорошо соответствовать данным.
Мои вопросы
1) Модель будет соответствовать данным, но я не думаю, что это проблема ML, а проблема модели как таковой. Потому что, используя ML для не приводит к переоснащению. Я прав?
2) По сравнению с байесовским, ML имеет некоторые недостатки, так как он просто дает точечную оценку параметров модели , и он самоуверен. Принимая во внимание, что байесовский метод зависит не только от наиболее вероятного значения параметра, но и от всех возможных значений параметров с учетом наблюдаемых данных , верно?
3) Почему байесовский может избежать или уменьшить переоснащение? Насколько я понимаю, мы можем использовать байесовский метод для сравнения моделей, то есть, учитывая данные , мы могли бы определить предельную вероятность (или свидетельство модели) для каждой рассматриваемой модели, а затем выбрать ту, которая имеет наибольшую предельную вероятность, верно ? Если так, то почему?