Бесплодные плато в обучающих ландшафтах квантовой нейронной сети


9

Здесь авторы утверждают, что усилия по созданию масштабируемой квантовой нейронной сети с использованием набора параметризованных вентилей считаются неудачными для большого числа кубитов. Это связано с тем, что из- за леммы Леви градиент функции в многомерных пространствах почти везде равен нулю.

Мне было интересно, может ли этот аргумент быть применен и к другим гибридным квантово-классическим методам оптимизации, таким как VQE (Variational Quantum Eigensolver) или QAOA (Quantum Approximate Optimizer Algorithm).

Что вы думаете?


"используя набор параметризованных вентилей" Что установить? Случайно ли это случайно?
rrtucci

Статья была написана Джарродом МакКлином, который также является пионером VQE. Я полагаю, Джаррод не верит, что VQE считается неудачным для большего числа кубитов. Я думаю, что ваше описание леммы Леви немного отличается от того, что предлагается в статье. Вы говорите, что «градиент функции в многомерных пространствах почти везде равен нулю», но в документе говорится только, что это имеет место в конкретном контексте QNN, описанных в статье.
user1271772

Чтобы немного прояснить мой последний комментарий: можно просто построить многомерную функцию, которая очень быстро меняется везде, у нее не будет градиента "почти ноль" везде. Вывод, основанный на лемме Леви в статье, касается конкретной функции, которую они оптимизируют, а не «любой» функции в многомерном пространстве.
user1271772

1
@asdf: Проведя большую часть дня, оглядываясь назад и вперед на бумаге, я наконец-то нашел ответ для вас. Взглянуть.
user1271772

Ответы:


4

Первое : в статье упоминается [ 37 ] для леммы Леви, но вы не найдете упоминания о «лемме Леви» в [37]. Вы найдете его под названием «Неравенство Леви», которое в данном случае называется леммой Леви , которое не упоминается в упомянутой вами статье.

Второе : есть простое доказательство того, что это утверждение ложно для VQE. В квантовой химии мы оптимизируем параметры анзаца волновой функции|Ψ(p)чтобы получить самую низкую (то есть самую точную) энергию. Энергия оценивается:

Ep=Ψ(p)|H|Ψ(p)Ψ(p)|Ψ(p).

VQE просто означает, что мы используем квантовый компьютер для оценки этой энергии и классический компьютер, чтобы выбрать, как улучшить параметры в p так что энергия будет ниже в следующей квантовой итерации.

Так будет ли или нет "градиент будет 0 почти везде, когда число параметров в pявляется большим "не зависит вообще от того, используем ли мы VQE (на квантовом компьютере) или просто запускаем стандартную программу квантовой химии (например, гауссовскую ) на классическом компьютере. Квантовые химики, как правило, вариационно оптимизируют вышеуказанную энергию до1010 параметры в pИ единственная причина, по которой мы не идем дальше, это то, что у нас заканчивается ОЗУ, а не потому, что энергетический ландшафт начинает становиться плоским. В этой статье вы можете увидеть в конце реферата, что они рассчитали энергию для волновой функции с примерно1012параметры , где параметры являются коэффициентами определителей Слейтера. Общеизвестно, что энергетический ландшафт не такой плоский (как это было бы, если бы градиент был почти везде 0), даже если есть триллион параметров или даже больше.

Вывод : применение леммы Леви будет зависеть от того энергетического ландшафта, который у вас есть, который будет зависеть от обоих H и твой анзац |Ψ(p), В случае их конкретной реализации QNN они сочли уместным применение леммы Леви. В случае VQE у нас есть контрпример к утверждению, что лемма Леви «всегда» применяется. Контрпример, где лемма Леви не применяется, это когдаHявляется молекулярным гамильтонианом и|Ψявляется волновой функцией КИ .

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.