Вы ошибаетесь, что HMC не является методом цепочки Маркова. В Википедии :
В математике и физике гибридный алгоритм Монте-Карло, также известный как гамильтониан Монте-Карло, представляет собой цепной метод Монте-Карло Маркова для получения последовательности случайных выборок из распределения вероятностей, для которого прямая выборка затруднена. Эта последовательность может использоваться для аппроксимации распределения (т. Е. Для генерации гистограммы) или для вычисления интеграла (например, ожидаемого значения).
Для большей ясности прочтите статью arXiv от Betancourt , в которой упоминаются критерии завершения NUTS:
... определить, когда траектория является достаточно длинной, чтобы обеспечить достаточное исследование окрестности вокруг текущего установленного уровня энергии. В частности, мы хотим избежать как слишком короткой интеграции, и в этом случае мы не будем в полной мере использовать гамильтоновы траектории, так и слишком долгой интеграции, и в этом случае мы тратим драгоценные вычислительные ресурсы на разведку, которая дает только убывающую отдачу.
Приложение A.3 говорит о чем-то вроде траектории удвоения, которую вы упоминаете:
Мы также можем расширяться быстрее, удваивая длину траектории на каждой итерации, получая выборочную траекторию t ∼ T (t | z) = U T2L с соответствующим дискретным состоянием z ′ ∼ T (z ′ | t). В этом случае как старые, так и новые компоненты траектории на каждой итерации эквивалентны листьям совершенных, упорядоченных бинарных деревьев (рис. 37). Это позволяет нам рекурсивно строить новые компоненты траектории, распространяя выборку на каждом этапе рекурсии ...
и расширяет это в A.4, где говорится о динамической реализации (раздел A.3 говорит о статической реализации):
К счастью, эффективные статические схемы, обсуждаемые в разделе A.3, могут быть повторены для достижения динамической реализации, как только мы выбрали критерий для определения, когда траектория выросла достаточно долго, чтобы удовлетворительно исследовать соответствующий набор уровней энергии.
Я думаю, что ключ в том, что он не делает двойные прыжки, он рассчитывает свой следующий прыжок, используя технику, которая удваивает длину предлагаемого прыжка до тех пор, пока критерий не будет удовлетворен. По крайней мере, так я понимаю статью до сих пор.