9
Зачем использовать softmax вместо стандартной нормализации?
В выходном слое нейронной сети обычно используется функция softmax для аппроксимации распределения вероятностей: Это дорого вычислять из-за показателей. Почему бы просто не выполнить Z-преобразование, чтобы все выходы были положительными, а затем нормализовать, просто разделив все выходы на сумму всех выходов?