Я понимаю, что предварительная подготовка используется, чтобы избежать некоторых проблем с обычным обучением. Если я использую обратное распространение, скажем, с помощью автоматического кодера, я знаю, что у меня возникнут проблемы со временем, потому что обратное распространение идет медленно, а также что я могу застрять в локальном оптимуме и не изучить некоторые функции.
Чего я не понимаю, так это как мы готовим сеть и что конкретно делаем, чтобы подготовить. Например, если бы нам дали стек ограниченных машин Больцмана, как бы мы подготовили эту сеть?