Предыстория: при настройке нейронных сетей с активацией Relu я обнаружил, что иногда прогноз становится почти постоянным. Я полагаю, что это связано с гибелью нейронов релу во время тренировок, как указано здесь. (В чем проблема «умирающего ReLU» в нейронных сетях? )
Вопрос: Что я надеюсь сделать, так это реализовать проверку в самом коде, чтобы проверить, не умерли ли нейроны. После этого код может восстановить сеть при необходимости.
Таким образом, что такое хорошая читерия для проверки мертвых нейронов? В настоящее время я думаю о проверке на низкую дисперсию в прогнозе в виде цитерии.
Если это помогает, я использую керас.