Искусственный интеллект proofs

2

Почему Q-обучение не сходится при использовании приближения функций?

Алгоритм табличного Q-обучения гарантированно найдет оптимальную QQQ функцию, Q∗Q∗Q^* , при условии, что выполнены следующие условия (условия Роббинса-Монро ) относительно скорости обучения ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)<∞∑tαt2(s,a)<∞\sum_{t} \alpha_t^2(s, a) < \infty где αt(s,a)αt(s,a)\alpha_t(s, a) означает скорость обучения, используемую при обновлении значения QQQ связанного с состоянием sss и действием aaa …

12 reinforcement-learning q-learning deep-rl proofs function-approximation

8

Доказательство того, что искусственный общий интеллект возможен

В информатике предполагается, что человеческий разум можно воспроизвести с помощью машины Тьюринга, поэтому возможен искусственный общий интеллект (AGI). Предполагать иначе - значит верить во что-то мистическое, а мистические убеждения ложны. Я не знаю ни одного другого аргумента о том, что АГИ возможен, и приведенный выше аргумент чрезвычайно слаб. Есть ли …

11 philosophy agi proofs

1

Какое значение имеет теорема «Нет бесплатного обеда» для машинного обучения?

Теорема об отсутствии бесплатного обеда (НФЛ) (см. Статью «Коэволюционные бесплатные обеды » Дэвида Х. Вольперта и Уильяма Дж. Макриди) любые два алгоритма эквивалентны, когда их производительность усредняется по всем возможным проблемам Действительно ли теорема «Нет бесплатного обеда» верна? Что это на самом деле означает? Хороший пример (в контексте ML), иллюстрирующий …

10 machine-learning optimization proofs no-free-lunch

Вопросы с тегом «proofs»