Выходные данные Softmax генерируют неотрицательный вектор, который суммируется с 1. Это полезно, когда у вас есть взаимоисключающие категории («эти изображения содержат только кошек или собак, а не обе»). Вы можете использовать softmax, если у вас есть взаимоисключающие ярлыки.2,3,4,5,...
Используя сигмоидные выходные данные создают вектор, где каждый элемент является вероятностью. Это полезно, когда у вас есть категории, которые не являются взаимоисключающими («эти изображения могут содержать кошек, собак или кошек и собак вместе»). Вы используете столько сигмовидных нейронов, сколько у вас есть категорий, и ваши ярлыки не должны быть взаимоисключающими.2,3,4,...
Симпатичный трюк в том, что вы также можете использовать один сигмовидный блок, если у вас есть взаимоисключающая двоичная проблема; Поскольку для оценки можно использовать одну сигмовидную единицу , из аксиом Колмогорова следует, что .p(y=1)1−p(y=1)=p(y=0)
Использование функции идентификации в качестве вывода может быть полезно, когда ваши выводы не ограничены. Прибыль или убыток какой-либо компании за квартал может быть неограниченным с обеих сторон.
Блоки ReLU или аналогичные варианты могут быть полезны, когда выход ограничен выше или ниже. Если вывод ограничен только неотрицательным, то имеет смысл использовать активацию ReLU в качестве функции вывода.
Аналогично, если выходные данные каким-то образом ограничены значением , tanh может иметь смысл.[−1,1]
Приятной особенностью нейронных сетей является то, что они невероятно гибкие инструменты.