Я прочитал пару статей об инициализации ядра, и многие из них упоминают, что они используют L2-регуляризацию ядра (часто с ).
Кто-нибудь делает что-то иное, чем инициализация смещения с постоянным нулем и не регуляризация?
Документы инициализации ядра
- Мишкин и Матас: все, что вам нужно, это хороший инициат
- Ксавье Глорот и Йошуа Бенжио: понимание сложности обучения глубоких нейронных сетей с прямой связью
- Он и соавт., Углубляясь в выпрямители: превосходящие человеческий уровень в классификации ImageNet