Вопросы с тегом «machine-learning»

Для вопросов, связанных с машинным обучением (ML), который представляет собой набор методов, которые могут автоматически обнаруживать шаблоны в данных, а затем использовать непокрытые шаблоны для прогнозирования будущих данных или для выполнения других видов принятия решений в условиях неопределенности (например, планирование как собрать больше данных). ОД обычно делят на контролируемое, неконтролируемое и подкрепляющее обучение. Глубокое обучение - это подполе ML, в котором используются глубокие искусственные нейронные сети.

17
В чем разница между искусственным интеллектом и машинным обучением?
Эти два термина, кажется, связаны, особенно в их применении в компьютерных науках и разработке программного обеспечения. Является ли подмножество другого? Один инструмент используется для построения системы для другого? Каковы их различия и почему они значимы?

8
Почему Python такой популярный язык в области ИИ?
Прежде всего, я новичок в изучении искусственного интеллекта, и это не вопрос, ориентированный на мнение или сравнение языков программирования. Я не имею в виду, что Python - лучший язык. Но дело в том, что большинство известных фреймворков ИИ имеют основную поддержку Python. Они могут даже поддерживаться на нескольких языках, например, …

3
Как нейронные сети могут работать с различными размерами входных данных?
Насколько я могу судить, нейронные сети имеют фиксированное количество нейронов во входном слое. Если нейронные сети используются в контексте, подобном NLP, предложения или блоки текста разных размеров подаются в сеть. Как варьируется размер входного сигнала с фиксированным размером входного слоя сети? Другими словами, как сделать такую ​​сеть достаточно гибкой, чтобы …

4
Нейронные сети склонны к катастрофическому забвению?
Представьте, что вы показываете нейронной сети изображение льва 100 раз и помечаете его как «опасный», чтобы узнать, что львы опасны. Теперь представьте, что ранее вы показали ему миллионы изображений львов и альтернативно пометили его как «опасный» и «не опасный», так что вероятность того, что лев опасен, составляет 50%. Но эти …

3
Почему Лисп такой хороший язык для ИИ?
Ранее я слышал от компьютерных ученых и от исследователей в области ИИ, что этот Лисп - хороший язык для исследований и разработок в области искусственного интеллекта. Это все еще применимо, с распространением нейронных сетей и глубокого обучения? Каковы были их причины для этого? На каких языках в настоящее время встроены …


4
Как выбрать количество скрытых слоев и количество ячеек памяти в LSTM?
Я пытаюсь найти некоторые существующие исследования о том, как выбрать количество скрытых слоев и размер этих RNN на основе LSTM. Есть ли статья, в которой исследуется эта проблема, т. Е. Сколько ячеек памяти следует использовать? Я предполагаю, что это полностью зависит от приложения и в каком контексте используется модель, но …


2
Можно ли постепенно обучать нейронную сеть?
Я хотел бы обучить нейронную сеть, где выходные классы не определены (все) с самого начала. Все больше и больше классов будут введены позже на основе входящих данных. Это означает, что каждый раз, когда я представляю новый класс, мне нужно будет переучивать NN. Как я могу обучать NN постепенно, то есть, …


4
Как обрабатывать недопустимые движения в обучении подкреплению?
Я хочу создать ИИ, который может играть пять в ряд / гомоку. Как я уже упоминал в названии, я хочу использовать для этого обучение с подкреплением. Я использую метод градиента политики , а именно REINFORCE, с базовым уровнем. Для приближения значения и функции политики я использую нейронную сеть . Имеет …

7
Если цифровые значения являются просто оценками, почему бы не вернуться к аналоговым для ИИ?
Толчком к переходу двадцатого века с аналоговых на цифровые схемы послужило стремление к большей точности и снижению шума. Сейчас мы разрабатываем программное обеспечение, результаты которого приблизительны, а шум имеет положительное значение. В искусственных сетях мы используем градиенты (якобиан) или модели второй степени (гессиан) для оценки следующих шагов в сходящемся алгоритме …

3
Понимание функции потери GAN
Я изо всех сил пытаюсь понять функцию потери GAN, как это предусмотрено в статье « Понимание порождающих противоборствующих сетей» (сообщение в блоге, написанное Дэниелом Сейта). В стандартной кросс-энтропийной потере мы имеем выход, который был пропущен через сигмовидную функцию и полученную двоичную классификацию. Сиета заявляет Таким образом, для [каждой] точки данных …

1
Различия между методами обратного распространения
Ради интереса я пытаюсь разработать нейронную сеть. Теперь для обратного распространения я увидел две техники. Первый используется здесь и во многих других местах. Что это делает: Он вычисляет ошибку для каждого выходного нейрона. Он распространяет его обратно в сеть (вычисляя ошибку для каждого внутреннего нейрона). Он обновляет веса по формуле: …

3
Какова сложность времени для обучения нейронной сети с использованием обратного распространения?
Предположим, что NN содержит nnn скрытых слоев, mmm обучающих примеров, xxx объектов и ninin_i узлов на каждом уровне. Какова сложность времени для обучения этой NN с использованием обратного распространения? У меня есть базовая идея о том, как они находят временную сложность алгоритмов, но здесь есть 4 различных фактора, которые необходимо …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.