Мы определяем архитектуру узких мест как тип, найденный в статье ResNet, где [два конвексных слоя 3x3] заменяются на [один конв 1x1, один конв 3x3 и еще один слой конвекс 1x1].
Я понимаю, что конвексные слои 1x1 используются как форма уменьшения размеров (и восстановления), что объясняется в другом посте . Однако мне неясно, почему эта структура столь же эффективна, как и оригинальная компоновка.
Вот несколько хороших объяснений: какая длина шага используется и на каких слоях? Каковы примерные входные и выходные размеры каждого модуля? Как карты характеристик 56x56 представлены на диаграмме выше? Относится ли 64-й к количеству фильтров, почему это отличается от 256-дневных фильтров? Сколько весов или флопов используются на каждом слое?
Любая дискуссия с благодарностью!