Можно ли ускорить генерацию весовой матрицы с помощью квантового алгоритма?


9

В этой [1] статье на странице 2 они упоминают, что они генерируют весовую матрицу следующим образом:

Wзнак равно1Md[Σмзнак равно1мзнак равноMИкс(м)(Икс(м))T]-яdd

где «s являются - мерные образцы обучения (то есть , где ) и всего имеется обучающих выборок. Такое генерирование весовой матрицы с использованием умножения матриц с последующим суммированием по слагаемым представляется дорогостоящей операцией с точки зрения сложности времени, т. Е. Я предполагаю около (?).Икс(м)dИксзнак равно{Икс1,Икс2,,,,,Иксd}Txi{1,1}  i{1,2,...,d}MMO(Md)

Существует ли какой-либо квантовый алгоритм, который может существенно ускорить генерацию матрицы весов? Я думаю, что в статье их основное ускорение происходит из-за алгоритма инверсии квантовой матрицы (который упоминается позже в статье), но они, похоже, не приняли во внимание этот аспект генерации матрицы весов.

[1]: Квантовая нейронная сеть Хопфилда Lloyd et al. (2018)

Ответы:


5

Взяв матрицу плотности

ρзнак равноW+яddзнак равно1MΣмзнак равно1M|Икс(м)Икс(м)|,
многие детали содержатся в следующем абзаце на странице 2:

Для квантовых адаптаций нейронных сетей решающее значение имеет классическое считывание моделей активации. В наших настройках чтение в шаблоне активацииИкс составляет подготовку квантового состояния |Икс>, Это в принципе может быть достигнуто с использованием методов разработки квантовой оперативной памяти (qRAM) [33] или эффективной подготовки квантовых состояний, для которых существуют ограниченные, основанные на оракулах результаты [34]. В обоих случаях вычислительные затраты являются логарифмическими с точки зренияd, В качестве альтернативы можно адаптировать полностью квантовую перспективу и взять шаблоны активации|Икс>непосредственно с квантового устройства или как выход квантового канала. Для первого наше время подготовки к подготовке эффективно, когда квантовое устройство состоит из множества вентилей, масштабируемых максимально за полиномиальное число кубитов. Вместо этого для последнего мы обычно рассматриваем канал как некую форму фиксированного взаимодействия системы и среды, которая не требует вычислительных затрат для реализации.

Ссылки в приведенном выше являются:

[33]: В. Джованетти, С. Ллойд, Л. Maccone, память с произвольным доступом Квант, Physical Review Letters 100, 160501 (2008) [ ПРЛ ссылку , Arxiv ссылка ]

[34]: А. Н. Соклаков, Р. Шак, Эффективная подготовка состояний для регистра квантовых битов, Physical Review A 73, 012307 (2006). [ АРП ссылка , Arxiv ссылка ]


Не вдаваясь в детали того, как оба вышеперечисленных действительно являются схемами для реализации эффективной реализации qRAM; и эффективная государственная подготовка, воссоздающая состояние|x во время O(log2d),

Тем не менее, это только доходит до нас: это может быть использовано для создания государства ρ(m)=|x(m)x(m)|в то время как мы хотим получить сумму по всем возможным m«S.

Кардинально, ρ=mρ(m)/M является смешанным, поэтому не может быть представлен одним чистым состоянием, поэтому вторая из двух вышеупомянутых ссылок на воссоздание чистых состояний не применяется, а первая требует, чтобы это состояние уже было в qRAM.

Таким образом, авторы делают одно из трех возможных предположений:

  1. У них есть устройство, которое как раз и дает им правильное состояние ввода

  2. У них либо есть штаты ρ(m) в qRAM,

  3. Они могут создавать эти состояния по своему усмотрению, используя вторую из приведенных выше ссылок. Затем смешанное состояние создается с использованием квантового канала (то есть полностью положительной, сохраняющей след карты (CPTP)).

На данный момент забывая о первых двух из вышеперечисленных вариантов (первый волшебным образом решает проблему в любом случае), канал может быть:

  • спроектированная система, в которой она будет создана для конкретного экземпляра в чем-то, похожем на аналоговое моделирование. Другими словами, у вас есть физический канал, который занимает физическое времяt(в отличие от некоторой временной сложности). Это «фиксированное взаимодействие системы и среды, которое не требует вычислительных затрат для реализации».

  • Канал сам симулируется. Есть несколько работ по этому вопросу, например, « Приближенное моделирование квантовых каналов» Бени и Орешкова ( ссылка arXiv - это похоже на тщательную работу, но я не смог найти никаких заявлений о сложности времени), Lu et. и др. в экспериментальном моделировании квантового канала (не версия Arxiv, кажется, существует) и Вэй Синь и Лонга Arxiv препринт Эффективного моделирования универсального квантового канала в облаке квантового компьютера от IBM , который (для числа кубитовn=log2d) дает временную сложность O((8n3+n+1)42n), Также может использоваться расширение Stinespring, со сложностьюO(27n343n),


Теперь, глядя на вариант 2 1 , одним из возможных более эффективных методов будет передача состояний из регистра адресов в регистр данных обычным способом: для адресов в регистреa, jψj|ja, передача этого в регистр данных дает состояние в регистре данных d в виде jψj|ja|Djd, Должна быть возможность просто декодировать регистр адреса и данных, чтобы преобразовать его в смешанное состояние, что приводит к небольшим накладным расходам времени, хотя не требует дополнительных затрат вычислительной сложности, что дает значительно улучшенную сложность созданияρ, учитывая qRAM с состояниями |x(m)из O(n), Это также сложность создания государств|x(m) во-первых, давая потенциальную (значительно улучшенную) сложность производства ρ из O(n),

1 Спасибо @glS за указание этой возможности в чате


Эта матрица плотности затем подается в qHop (квантовый хопфилд), где она используется для моделирования eiAt за

A=(WγIdPP0)
согласно подразделу « Эффективное гамильтоново моделирование A » на странице 8.

просто небольшая заметка о вашем редактировании: вам на самом деле не нужно «декорировать» адресный регистр или вообще что-то делать. Простой факт неиспользования делает содержимое регистра данных неотличимым от смеси различных|Dj
GLS
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.