Вопросы с тегом «proofs»

2
Почему Q-обучение не сходится при использовании приближения функций?
Алгоритм табличного Q-обучения гарантированно найдет оптимальную QQQ функцию, Q∗Q∗Q^* , при условии, что выполнены следующие условия (условия Роббинса-Монро ) относительно скорости обучения ∑tαt(s,a)=∞∑tαt(s,a)=∞\sum_{t} \alpha_t(s, a) = \infty ∑tα2t(s,a)&lt;∞∑tαt2(s,a)&lt;∞\sum_{t} \alpha_t^2(s, a) < \infty где αt(s,a)αt(s,a)\alpha_t(s, a) означает скорость обучения, используемую при обновлении значения QQQ связанного с состоянием sss и действием aaa …

8
Доказательство того, что искусственный общий интеллект возможен
В информатике предполагается, что человеческий разум можно воспроизвести с помощью машины Тьюринга, поэтому возможен искусственный общий интеллект (AGI). Предполагать иначе - значит верить во что-то мистическое, а мистические убеждения ложны. Я не знаю ни одного другого аргумента о том, что АГИ возможен, и приведенный выше аргумент чрезвычайно слаб. Есть ли …
11 philosophy  agi  proofs 

1
Какое значение имеет теорема «Нет бесплатного обеда» для машинного обучения?
Теорема об отсутствии бесплатного обеда (НФЛ) (см. Статью «Коэволюционные бесплатные обеды » Дэвида Х. Вольперта и Уильяма Дж. Макриди) любые два алгоритма эквивалентны, когда их производительность усредняется по всем возможным проблемам Действительно ли теорема «Нет бесплатного обеда» верна? Что это на самом деле означает? Хороший пример (в контексте ML), иллюстрирующий …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.