Производная перекрестной потери энтропии в word2vec


10

Я пытаюсь проработать первый набор проблем из материала онлайн-курса cs224d в Стэнфорде, и у меня возникли некоторые проблемы с проблемой 3A: При использовании модели пропуска грамм word2vec с функцией прогнозирования softmax и функцией кросс-энтропийной потери мы хочу вычислить градиенты по отношению к предсказанным векторам слов. Итак, учитывая функцию softmax:

веся^знак равноPr(весорdя|р^,вес)знак равноехр(весяTр^)ΣJ|В|еИксп(весJTр^)

и кросс-энтропийная функция:

СЕ(вес,вес^)знак равно-ΣКвесКLог(весК^)

нам нужно вычислить СЕр^

Мои шаги следующие:

СЕ(вес,вес^)знак равно-ΣК|В|весКLог(ехр(весКTр^)ΣJ|В|еИксп(весJTр^))

знак равно-ΣК|В|весКLог(ехр(весКTр^)-весКLог(ΣJ|В|еИксп(весJTр^))

теперь данный весК - один горячий вектор, и я - правильный класс:

СЕ(вес,вес^)знак равно-весяTр^+Lог(ΣJ|В|еИксп(весJTр^))

СЕр^знак равно-веся+1ΣJ|В|еИксп(весJTр^)ΣJ|В|еИксп(весJTр^)весJ

Это правильно или это может быть упрощено дальше? Я хочу убедиться, что я на правильном пути, поскольку решения проблем не публикуются в Интернете. Кроме того, правильное выполнение письменных заданий важно для правильного выполнения заданий по программированию.


Пожалуйста, добавьте тег самообучения к вопросу
Dawny33

2-й знак минус в первом логе должен быть плюсом. Попытка исправить это для вас, но изменения должны быть не менее 6 символов: \
FatalMojo

Ответы:


7

СЕр^знак равно-веся+1ΣJ|В|еИксп(весJTр^)ΣJ|В|еИксп(весJTр^)весJ
можно переписать как обратите внимание, обе суммы проиндексированы j, но на самом деле это должны быть 2 разные переменные. Это было бы более уместно что переводится как
СЕр^знак равно-веся+ΣJ|В|(ехр(весJр^)ΣJ|В|еИксп(весJTр^)весJ)
СЕр^знак равно-веся+ΣИкс|В|(ехр(весИкср^)ΣJ|В|еИксп(весJTр^)весИкс)
СЕр^знак равно-веся+ΣИкс|В|Pr(весорdИкс|р^,вес)весИкс

1
В связи с этим он подробно расскажет об этом выводе в лекции 2 @ 38:00
FatalMojo,

Почему суммы должны индексироваться разными переменными?
Яманеко

1
Просто чтобы избежать путаницы. Математически это означает то же самое, но хорошей практикой является изменение метки индекса при добавлении новой суммы.
FatalMojo
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.