Ответы:
Формально одного скрытого слоя достаточно для аппроксимации непрерывной функции с любой требуемой степенью точности, поэтому в этом смысле вам никогда не потребуется больше 1. Это называется теоремой универсального приближения .
Поиск наилучшей топологии для данной проблемы является проблемой открытого исследования. Насколько я знаю, для этого есть несколько универсальных «практических правил».
Для данной проблемы одним из вариантов является применение нейроэволюционного подхода, такого как NEAT , который пытается найти топологию, которая хорошо подходит для рассматриваемой проблемы.