Вывод регуляризованной функции стоимости линейной регрессии на курс Coursera Machine Learning


12

Я взял курс Эндрю Нг «Машинное обучение» через Coursera несколько месяцев назад, не обращая внимания на большую часть математики / дериваций и вместо этого сосредоточившись на практической реализации. С тех пор я начал возвращаться к изучению основополагающей теории и пересмотрел некоторые лекции профессора Нга. Я читал его лекцию «Регулярная линейная регрессия» и увидел, что он дал следующую функцию стоимости:

J(θ)=12m[i=1m(hθ(x(i))y(i))2+λj=1nθj2]

Затем он дает следующий градиент для этой функции стоимости:

θjJ(θ)=1m[i=1m(hθ(x(i))y(i))xj(i)λθj]

Я немного озадачен тем, как он переходит от одного к другому. Когда я попытался сделать свой собственный вывод, у меня был следующий результат:

θjJ(θ)=1m[i=1m(hθ(x(i))+y(i))xj(i)+λθj]

Разница заключается в том, что знак «плюс» между исходной функцией стоимости и параметром регуляризации в формуле профессора Нга превращается в знак «минус» в его функции градиента, тогда как в моем результате этого не происходит.

Интуитивно я понимаю, почему это отрицательно: мы уменьшаем тэта-параметр на величину градиента, и мы хотим, чтобы параметр регуляризации уменьшил величину изменения параметра, чтобы избежать переобучения. Я просто немного застрял в исчислении, которое поддерживает эту интуицию.

К вашему сведению, вы можете найти колоду здесь , на слайдах 15 и 16.


1
В вашем результате у вас есть « + » перед y ^ (i) - это опечатка?
Стив С

Ответы:


12

J(θ)=12m[i=1m(hθ(x(i))y(i))2+λj=1nθj2]

Сейчас же

θj(hθ(x(i))y(i))2=2[(hθ(x(i))y(i))θj{hθ(x(i))}]

θj(hθ(x(i))=[x(i)]j

θjλj=1nθ2=2λθj

Так что для линейного случая

θjJ(θ)=1m[i=1m(hθ(x(i))y(i))xj(i)+λθj]

Похоже, что и у вас с Эндрю могут быть опечатки. Ну, по крайней мере двое из нас, кажется,


это подтверждено, просто опечатка на записке Эндрю, это должен быть знак +. И Проф правильно все объясняет правильно, включая интуицию θ (1-α (λ / m)), означающую каждый раз, когда это сокращение θ, то минус обычная часть до введения регуляризации.
Gob00st

4

На самом деле, если вы проверяете конспект лекций сразу после видео, он показывает формулу правильно. Выложенные здесь слайды показывают точный слайд видео.

введите описание изображения здесь


coursera.org/learn/machine-learning/supplement/pKAsc/… здесь ссылка на заметки сразу после видео, показывающего правильную формулу.
Gob00st

1

На самом деле, я думаю, что это просто опечатка.

αλθα

Есть смысл?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.