Если у вас есть оправданный Гесс приближение, то лучше использовать его , а не произвольная .В0= Я
Изменить: Обоснование состоит в том, что если вы начнете близко к решению , начальная скорость сходимости (для любого ) -шаговая линейная с -шаговым коэффициентом сходимостиесли это для некоторой поправки ранга единичной матрицы. Таким образом, попытка сделать это маленьким очень ценно. (Это эквивалентно предварительной обработке системы.) Коэффициент сходимости улучшается со временем и в конечном итоге приближается к нулю (суперлинейная сходимость), но во многих реальных задачах (особенно многомерных) никогда не делается достаточно итераций, чтобы достичь суперлинейного режима. Таким образом, начальная скорость довольно важна.Икс*г > 0г + 1г + 1Q= ∥В- 10е''(Икс*) - G ∥< 1рг
Одним важным случаем является решение нелинейных задач наименьших квадратов (минимизировать ), где приближение Гаусса-Ньютона исходного гессиана может быть вычисляется без необходимости вторых производных. Его использование делает метод BFGS аффинно-инвариантным, т. Е. Инвариантным относительно линейных преобразований таких как метод Ньютона, что обычно очень полезно.∥ F( х )∥22В0знак равноF'(Икс0)TF'(Икс0)Икс
Еще один важный случай, когда вы решаете ряд связанных проблем. Часто перезапуск решателя с окончательным гессенским приближением предыдущей задачи значительно уменьшает количество необходимых итераций.