Это о регуляризации. Предположим, вы хотите подогнать кривую и использовать функцию квадрата потерь (вы можете выбрать другую). ПоfitВы хотели бы восстановить параметры, которые управляют процессом, который генерировал эту кривую. Теперь представьте, что вы хотите подогнать эту кривую, используя 100-й полином (например). Скорее всего, вы собираетесь надеть или захватить каждый излом и шум кривой. Кроме того, ваши возможности прогнозирования вне заданного интервала обучающих данных, вероятно, будут очень плохими. Таким образом, термин регуляризации добавляется к целевой функции с некоторым весом, умноженным на коэффициент регуляризации - l_1, l_2 или пользовательский. В случае l_2, который, пожалуй, проще понять, это приведет к тому, что большие значения параметров будут вынуждены уменьшить сокращение. Вы можете думать о регуляризации или сокращении как о том, что ваш алгоритм ведет к решению, которое может быть лучшим решением.