Это о регуляризации. Предположим, вы хотите подогнать кривую и использовать функцию квадрата потерь (вы можете выбрать другую). Поfit
Вы хотели бы восстановить параметры, которые управляют процессом, который генерировал эту кривую. Теперь представьте, что вы хотите подогнать эту кривую, используя 100-й полином (например). Скорее всего, вы собираетесь надеть или захватить каждый излом и шум кривой. Кроме того, ваши возможности прогнозирования вне заданного интервала обучающих данных, вероятно, будут очень плохими. Таким образом, термин регуляризации добавляется к целевой функции с некоторым весом, умноженным на коэффициент регуляризации - l_1, l_2 или пользовательский. В случае l_2, который, пожалуй, проще понять, это приведет к тому, что большие значения параметров будут вынуждены уменьшить сокращение. Вы можете думать о регуляризации или сокращении как о том, что ваш алгоритм ведет к решению, которое может быть лучшим решением.