Справочная информация: Многие современные исследования за последние ~ 4 года (post alexnet ), похоже, отошли от использования генеративной предварительной подготовки для нейронных сетей для достижения современных результатов классификации.
Например, лучшие результаты для mnist здесь включают только 2 статьи из 50 лучших, которые, кажется, используют генеративные модели, обе из которых являются RBM. Остальные 48 работ-победителей посвящены различным дискриминационным архитектурам прямой связи, при этом большое внимание уделяется поиску инициализирующих и новых функций веса и функций, отличных от сигмовидной, используемой в RBM и во многих старых нейронных сетях.
Вопрос: Есть ли какая-либо современная причина, чтобы больше использовать Машины с Ограниченным Больцманом?
Если нет, существует ли де-факто модификация, которую можно применить к этим архитектурам прямой связи, чтобы сделать любой из их уровней генеративным?
Мотивация: я спрашиваю, потому что некоторые из моделей, которые я вижу доступными, обычно варианты в RBM, не обязательно имеют очевидные аналогичные дискриминационные аналоги этим генеративным слоям / моделям, и наоборот. Например:
CRBM (хотя можно утверждать, что архитектуры прямой связи, используемые CNN, являются дискриминационной аналогичной архитектурой)
Кроме того, это были явно предварительные данные, начиная с 2010, 2011 и 2009 годов с уважением.