В книге Гудфеллоу (2016) о глубоком обучении он говорил об эквивалентности раннего прекращения регуляризации L2 ( https://www.deeplearningbook.org/contents/regularization.html стр. 247).
Квадратичная аппроксимация функции стоимости определяется как:
В книге Гудфеллоу (2016) о глубоком обучении он говорил об эквивалентности раннего прекращения регуляризации L2 ( https://www.deeplearningbook.org/contents/regularization.html стр. 247).
Квадратичная аппроксимация функции стоимости определяется как:
Ответы:
Они говорят о весах в оптимальном режиме:
Мы можем смоделировать функцию стоимости с квадратичным приближением в окрестности эмпирически оптимального значения весов
В этот момент первая производная равна нулю, поэтому средний член не учитывается.