Будут ли глубоко изученные нейронные сети работать на квантовых компьютерах?


15

Глубокое обучение (несколько слоев искусственных нейронных сетей, используемых в контролируемых и неконтролируемых задачах машинного обучения) является невероятно мощным инструментом для решения многих из самых сложных задач машинного обучения: распознавания изображений, распознавания видео, распознавания речи и т. Д. Учитывая, что в настоящее время оно из самых мощных алгоритмов машинного обучения, и Квантовые вычисления, как правило, считаются движущей силой для решения некоторых очень сложных вычислительных задач, мне интересно, было ли какое-то движение по объединению этих двух.

  • Может ли алгоритм глубокого обучения работать на квантовом компьютере?
  • Есть ли смысл попробовать?
  • Существуют ли другие квантовые алгоритмы, которые сделали бы глубокое обучение неактуальным?

1
Я не эксперт, но я думаю, что алгоритм HHL будет полезен в этом контексте.
DaftWullie

Ответы:


8
  1. Да, все классические алгоритмы могут быть запущены на квантовых компьютерах, более того, любой классический алгоритм, включающий поиск, может получить увеличение времени за счет использования алгоритма Гроверса. Пример, который приходит на ум, - это трактовка тонкой настройки параметров нейронной сети как проблема «поиска коэффициентов».оригинальное время

  2. На самом деле, в некоторых процессах есть явные преимущества в вычислительном отношении: да.

  3. Не то, что я знаю о. Но кто-то с большим опытом может позвонить сюда, если они хотят. Одна вещь, которая приходит на ум: часто мы можем использовать глубокое обучение и другие формы искусственного интеллекта для изучения проблем химии и физики, потому что моделирование дорого или непрактично. В этой области Квантовые Компьютеры, скорее всего, будут убивать своих классических предков, учитывая их способность естественным образом моделировать квантовые системы (например, в ядерной химии) в реальном времени или быстрее.

В последний раз, когда я говорил с ним, Марио Сегеди интересовался именно этим, вероятно, сейчас над этим работают и другие исследователи.


6
Я не уверен, что алгоритм Гровера уместен здесь. Алгоритм Гровера находит единственный уникальный вход, который точно производит данный вывод. OTOH, нейронные сети очень не уникальны по своей природе, и они также не совсем точны - в лучшем случае асимптотически точны.
оставил около

Это можно рассматривать как проблему поиска в базе данных, если смотреть на суперпозицию всех состояний, в которых могут находиться веса. Пусть функция поиска возвращает 1, если норма производной нейронной сети на стандартном входе по весам равна меньше, чем желаемый допуск.
frogeyedpeas

1
Это было бы совершенно бесполезно. Для любой нетривиальной задачи будет много комбинаций весов, при которых градиент равен нулю; даже если алгоритм Гровера даст вам один из них, он, как правило, не будет минимумом, а тем более глобальным минимумом.
оставил около

Я не согласен, учитывая следующий протокол: снижение градиента ванили до некоторого порога, а затем применение поиска Гровера среди очень ограниченного пространства весов, чтобы подобрать жесткий минимум в пределах некоторой границы ошибки, в этой конечной части градиентное снижение обычно сходится очень медленно к локальному оптимуму, и мне становится любопытно, может быть, здесь было бы интересно прибегнуть к поиску Гровера
frogeyedpeas

1
Хм, это может сработать; однако в этом конце я уверен, что вы могли бы сделать намного лучше, чем градиентный спуск с классическими средствами. Biconjugate-градиент является очевидным кандидатом.
оставил около

13

Это очень открытый вопрос, но да, на этом фронте проводится значительная работа.

Некоторые уточнения

Прежде всего следует отметить, что существует два основных способа объединить машинное обучение (и глубокое обучение в частности) с квантовой механикой / квантовыми вычислениями:

Применять классические методы машинного обучения для решения проблем, возникающих в контексте квантовой механики / квантовой информации / квантовых вычислений . Эта область растет слишком быстро, и я даже не пытаюсь найти приличный список ссылок, поэтому я просто сошлюсь напару самых последних работ в этом направлении: в 1803.04114 году авторы использовали подход машинного обучения, чтобы найти схемы для вычисления перекрытия. между двумя состояниями (существует ряд других работ в этом же направлении), и в 1803.05193 г. авторы изучили, как можно использовать глубокие нейронные сети для нахождения схем коррекции квантового управления.

Изучение квантовых алгоритмов для анализа больших данных , которое часто сводится к поиску « квантовых обобщений » классических алгоритмов машинного обучения. Вы можете взглянуть на этот другой мой ответ, чтобы получить некоторые основные ссылки на эту тему. Более конкретно для случая глубокого обучения , в 1412.3489 (метко названный Quantum Deep Learning ) авторы предлагают метод (эффективно квантовый алгоритм), чтобы вообще ускорить обучение глубоких, ограниченных машин Больцмана . Другая важная ссылка здесь - 1712.05304 , в которой авторы разрабатывают квантовый алгоритм с малой глубиной для обучения квантовых машин Больцмана. См 1708.09757, а также ссылки в связанном ответе, чтобы найти еще много работ по этому вопросу. Обратите внимание, что ускорение, заявленное в этих работах, может сильно варьироваться, от экспоненциальных ускорений до полиномиальных.

Иногда ускорение происходит из-за использования квантовых алгоритмов для решения конкретных линейных алгебраических задач (см., Например, таблицу 1 в ( 1707.08561 ), иногда это происходит из-за того, что в основном сводится к использованию (вариациям) поиска Гровера, а иногда из других вещи (но в основном это два). Цитата из Дунько и Бригеля здесь :

Идеи квантовых улучшений для ML можно грубо разделить на две группы: а) подходы, которые основаны на поиске Гровера и усилении амплитуды для получения ускорений до квадратичных значений, и, б) подходы, которые кодируют соответствующую информацию в квантовые амплитуды и которые имеют потенциал даже для экспоненциальных улучшений. Вторая группа подходов формирует, пожалуй, наиболее развитую исследовательскую линию в квантовом МЛ и собирает множество квантовых инструментов - прежде всего квантовой линейной алгебры, используемой в предложениях квантового МЛ.

Более прямой ответ на три вопроса

Сказав выше, позвольте мне более прямо ответить на три вопроса, которые вы подняли:

  1. Может ли алгоритм глубокого обучения работать на квантовом компьютере? Определенно да: если вы можете запустить что-то на классическом компьютере, вы можете сделать это на квантовых компьютерах. Тем не менее, вопрос, который следует задать, заключается в том, может ли квантовый (глубокий) алгоритм машинного обучения быть более эффективным, чем классические аналоги ? Ответ на этот вопрос сложнее. Возможно, да , есть много предложений в этом направлении, но пока рано говорить, что будет или не будет работать.

  2. Есть ли смысл попробовать? Да!

  3. Существуют ли другие квантовые алгоритмы, которые сделали бы глубокое обучение неактуальным? Это сильно зависит от того, что вы подразумеваете под « неактуальным ». Я имею в виду, что, как известно на данный момент, вполне могут существовать классические алгоритмы, которые сделают глубокое обучение «неактуальным».

3
В контексте этого ответа я хотел бы упомянуть эту недавнюю работу, в которой показано, как алгоритм квантовой приближенной оптимизации можно использовать для обучения нейронных сетей (ограниченных машин Больцмана) путем использования приближенной выборки Гиббса на универсальных квантовых компьютерах.
Марк Фингхут

1
@MarkFingerhuth Я добавил его в ответ, спасибо за указатель (и добро пожаловать на сайт!)
GLS

2

Вот последняя разработка от Xanadu, фотонная квантовая схема, которая имитирует нейронную сеть. Это пример нейронной сети, работающей на квантовом компьютере.

Эта фотонная схема содержит интерферометры и сжимающие затворы, которые имитируют функции взвешивания NN, вентиль смещения, действующий как смещение, и нелинейное преобразование, подобное функции ReLU NN.

Они также использовали эту схему для обучения сети для генерации квантовых состояний, а также для реализации квантовых вентилей.

Вот их публикация и код, используемый для обучения цепи . Вот средняя статья, объясняющая их схему.


2

Все ответы здесь, кажется, игнорируют фундаментальное практическое ограничение:

Глубокое обучение лучше всего работает с большими данными. MNIST - 60000 изображений, ImageNet - 14 миллионов изображений.

Между тем, крупнейшие квантовые компьютеры сейчас имеют 50 ~ 72 кубита.

Даже в самых оптимистичных сценариях квантовые компьютеры, которые могут обрабатывать объемы данных, которые требуют алгоритмов глубокого обучения вместо более традиционных методов моделирования, не появятся в ближайшее время.

Поэтому применение QC к Deep Learning может быть хорошим теоретическим любопытством, но не тем, что скоро станет практичным.

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.