Вопросы с тегом «dynamic-programming»

3
Когда не удается оптимальное управление (?)
Чтобы «задать свой вопрос», я должен сначала решить модель. Я опущу некоторые шаги, но тем не менее, это неизбежно сделает этот пост очень длинным - так что это также тест, чтобы увидеть, нравится ли этому сообществу такие вопросы. Прежде чем начать, я поясняю, что это может выглядеть полностью как стандартная …

1
Решение уравнения Гамильтона-Якоби-Беллмана; необходимо и достаточно для оптимальности?
Рассмотрим следующее дифференциальное уравнение где - это состояние, а - управляющая переменная. Решение дается где - заданное начальное состояние.xux(t)=x0+∫ t 0 f(x(s),u(s))ds. х0:=х(0)x˙(t)=f(x(t),u(t))x˙(t)=f(x(t),u(t))\begin{align} \dot x(t)=f(x(t),u(t)) \end{align}xxxuuux(t)=x0+∫t0f(x(s),u(s))ds.x(t)=x0+∫0tf(x(s),u(s))ds.\begin{align} x(t)=x_0 + \int^t_0f(x(s),u(s))ds. \end{align}x0:=x(0)x0:=x(0)x_0:=x(0) Теперь рассмотрим следующую программу где \ rho> 0 обозначает предпочтение времени, V (\ cdot) - значение, а F (\ cdot) …

6
Рекомендации для изучения непрерывного динамического программирования
Кто-нибудь знает хорошие ссылки для изучения непрерывного динамического программирования? Ссылки не должны быть книгами. Они также могут быть ссылками на онлайн-ресурсы. Были бы полезны ссылки на четкие, краткие обсуждения даже только основ.

1
Угадай и проверь
В динамическом программировании метод неопределенных коэффициентов иногда называют «угадай и проверь». Я периодически слышал, что есть какие-то канонические предположения. В частности, я видел V(k)=A+Bln(k)V(k)=A+Bln⁡(k)V(k) = A + B\ln(k) V(k)=Bk1−σ1−σV(k)=Bk1−σ1−σV(k) = \frac{Bk^{1-\sigma}}{1-\sigma} Первый относится к утилите журналов, а второй связан с настройками CRRA. Какие еще канонические предположения существуют и связаны ли …

2
Принцип однократного отклонения для бесконечных повторяющихся игр и динамического программирования
В контексте того, что будущая прибыль обесценивается постоянным параметром, принцип однократного отклонения верно как для повторных игр, так и для динамического программирования. Поскольку в повторяющихся играх отклонение от одного выстрела относится к одной истории, поэтому на пути равновесия отклонение от одного выстрела может привести к игре, которая отличается более чем …

2
Оптимизация с использованием функции стоимости
У меня есть следующая проблема оптимизации: max зависимости оту + М т - 1E0∑∞t=0[log(ct)+log(mt)]E0∑t=0∞[log(ct)+log(mt)]E_{0}\sum_{t=0}^{\infty}[log(c_{t}) + log(m_{t})]y+Mt−1pt+Rt−1Bt−1pt=ct+mt+bt+τty+Mt−1pt+Rt−1Bt−1pt=ct+mt+bt+τty + \frac{M_{t-1}}{p_{t}} + R_{t-1}\frac{B_{t-1}}{p_{t}} = c_{t} + m_{t}+b_{t}+\tau_{t} Где строчные буквы обозначают реальные переменные, а - номинальная валовая процентная ставка.RRR Я пытаюсь решить эту проблему, используя подход функции значения, но мне трудно понять, какой …

0
Естественный заем / лимит задолженности и другие ограничения заимствования
Столкнувшись с простой проблемой максимизации потребления домашних хозяйств в условиях неопределенности (и с последовательной торговлей безопасностью Arrow) $$ \ макс _ {\ {c_t (ы ^ т), а_ {T + 1} (с ^ т, S_ {T + 1}) \} _ {т = 0} ^ {\ infty}} \ sum_ {т = 0} …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.