Это относится к статье « Эффективная локализация объектов с использованием сверточных сетей» , и, насколько я понимаю, выпадение реализовано в 2D.
После прочтения кода из Keras о том, как реализован пространственный выпадение 2D, в основном реализована случайная двоичная маска формы [batch_size, 1, 1, num_channels]. Однако, что именно этот пространственный 2D-выпадет делает с входным блоком свертки формы [batch_size, height, width, num_channels]?
Мое текущее предположение состоит в том, что для каждого пикселя, если какой-либо из слоев / каналов пикселя имеет отрицательное значение, все каналы этого одного пикселя будут по умолчанию установлены на ноль. Это верно?
Однако, если мое предположение верно, то как обычная поэлементная выпадающая функция дает использование бинарной маски формы [batch_size, height, width, num_channels], которые точно находятся в измерении исходного входного блока (это соответствует оригинальная реализация выпадения тензорного потока, которая устанавливает форму двоичной маски как форму ввода)? Потому что это будет означать, что если какой-либо пиксель в блоке конвекции будет отрицательным, тогда весь блок конвоя будет по умолчанию равен 0. Это запутанная часть, которую я не совсем понимаю.