DeepMind заявляет, что их глубокая Q-сеть (DQN) была способна постоянно адаптировать свое поведение во время обучения игре в 49 игр Atari.
Изучив все игры с одной и той же нейронной сетью, мог ли агент играть в них все одновременно на «сверхчеловеческих» уровнях (всякий раз, когда он случайно отображался в одной из игр) или он мог быть хорош только в одной игре за раз, потому что переключение требуется переучиться?