2
Многочленные логистические потери против (перекрестная энтропия против квадратной ошибки)
Я заметил, что Caffe (структура глубокого обучения) использовала Softmax Loss Layer в SoftmaxWithLoss качестве выходного слоя для большинства образцов модели . Насколько я знаю, слой Softmax Loss представляет собой комбинацию Multinomial Logistic Loss Layer и Softmax Layer . От Кафе они сказали, что Расчет градиента слоя потерь Softmax более численно …