Можно ли дать эмпирическую оценку размера нейронных сетей, которые можно обучать на обычных графических процессорах потребительского уровня ? Например:
Бумага « Появление локомоции» («Укрепление») обучает сеть, используя активацию нейронов. У них есть 3-слойный NN с 300 200 100 единиц для Planar Walker . Но они не сообщают оборудование и время ...
Но может ли быть разработано эмпирическое правило? Также только на основе текущих эмпирических результатов, например:
X-юниты, использующие сигмоидальную активацию, могут выполнять Y итераций обучения в час на 1060.
Или использование функции активации a вместо b приводит к временному снижению производительности.
Если студент / исследователь / любопытный человек собирается купить графический процессор для игры с этими сетями, как вы решаете, что вы получите? 1060, по-видимому, является бюджетным вариантом начального уровня, но как вы можете оценить, если не разумнее просто купить дрянной нетбук вместо создания мощного рабочего стола и потратить сэкономленные $ на облачную инфраструктуру по требованию.
Мотивация для вопроса: я только что купил 1060 и (умный, чтобы задать вопрос потом да) задаюсь вопросом, должен ли я просто оставить $ и создать учетную запись Google Cloud. И если я смогу запустить симуляцию магистерской диссертации на GPU.