В контексте того, что будущая прибыль обесценивается постоянным параметром, принцип однократного отклонения верно как для повторных игр, так и для динамического программирования.
Поскольку в повторяющихся играх отклонение от одного выстрела относится к одной истории, поэтому на пути равновесия отклонение от одного выстрела может привести к игре, которая отличается более чем на один этап от первоначального пути равновесия.
Верно ли это для последовательности переменных состояния и управляющих переменных в динамическом программировании? Другими словами, может ли одноразовое отклонение генерировать вышеупомянутую последовательность, которая отличается для более чем одной стадии?