Вопросы с тегом «neural-networks»

Искусственные нейронные сети (ИНС) представляют собой широкий класс вычислительных моделей, в основе которых лежат биологические нейронные сети. Они включают в себя NN с прямой связью (включая "глубокие" NN), сверточные NN, рекуррентные NN и т. Д.

2
Что стоит на пути использования импульсных нейронных сетей в приложениях?
Импульсные или всплесковые нейронные сети включают в себя больше мембранной динамики биологических нейронов, где импульсы переносят информацию на следующий уровень. Нейроны не обязательно должны «выстреливать» все одновременно, как, например, в бэкпропе. Тем не менее, по-видимому, существуют препятствия для использования этих моделей для задач машинного обучения. Какие конкретные проблемы стоят на …

1
Как эффективно выполнять моделирование нейронной сети?
Каким должно быть соотношение количества наблюдений и количества переменных? Как обнаружить переоснащение в модели нейронной сети и как избежать переобучения? Если я хочу выполнить классификацию с помощью нейронной сети, должны ли классы иметь одинаковую частоту? Пожалуйста, помогите мне.

2
Почему RNN с блоками LSTM также могут страдать от «взрывных градиентов»?
У меня есть базовые знания о том, как работают RNN (и, в частности, с блоками LSTM). У меня есть графическое представление об архитектуре модуля LSTM, то есть ячейки и нескольких шлюзов, которые регулируют поток значений. Однако, по-видимому, я не до конца понял, как LSTM решает проблему «исчезающих и взрывающихся градиентов», …

4
Если каждый нейрон в нейронной сети в основном является функцией логистической регрессии, почему многослойность лучше?
Я прохожу курс DeepAI в Cousera (Неделя 3, видео 1 «Обзор нейронных сетей»), и Эндрю Нг объясняет, как каждый слой в нейронной сети - просто очередная логистическая регрессия, но он не объясняет, как это делает вещь более точной. Итак, в двухслойной сети, как многократный расчет логистики делает его более точным?

3
Теоретические результаты за искусственными нейронными сетями
Я только что рассказал об искусственных нейронных сетях на курсе машинного обучения Coursera, и я хотел бы узнать больше теории за ними. Я нахожу мотивацию, что они подражают биологии, несколько неудовлетворительно. На первый взгляд кажется, что на каждом уровне мы заменяем ковариаты линейной комбинацией их. Делая это многократно, мы учитываем …

3
Ограниченные машины Больцмана для регрессии?
Я слежу за вопросом, который я задавал ранее по УКР . Я вижу много литературы, описывающей их, но ни одной, которая фактически говорит о регрессии (даже не классификация с помеченными данными). У меня такое ощущение, что он используется только для немаркированных данных. Есть ли ресурсы для обработки регрессии? Или это …

2
Почему производные функции используются в нейронных сетях?
Например, кто-то хочет предсказать цены на жилье и имеет две входные характеристики: длину и ширину дома. Иногда, один также включает в себя «производные» полиномиальные входные объекты, такие как площадь, которая является длиной * шириной. 1) Какой смысл включать производные функции? Разве нейронная сеть не должна изучать связь между длиной, шириной …

3
Может кто-нибудь объяснить, пожалуйста, алгоритм обратного распространения? [Дубликат]
На этот вопрос уже есть ответы здесь : Алгоритм обратного распространения (2 ответа) Закрыто 3 месяца назад . Что такое алгоритм обратного распространения и как он работает?

1
Как обратное распространение работает в сиамской нейронной сети?
Я изучал архитектуру сиамской нейронной сети, представленной Янном ЛеКуном и его коллегами в 1994 году для распознавания подписей ( «Проверка подписи с использованием сиамской нейронной сети с временной задержкой». Pdf, NIPS 1994) Я понял общую идею этой архитектуры, но я действительно не могу понять, как работает обратное распространение в этом …


3
Скрытая марковская модель против рекуррентной нейронной сети
Какие проблемы последовательного ввода лучше всего подходят для каждого? Определяет ли входная размерность, какое из них лучше подходит? Являются ли проблемы, для которых требуется «более длинная память», более подходящими для RNN LSTM, а проблемы с циклическими шаблонами ввода (фондовый рынок, погода) легче решаются с помощью HMM? Кажется, что есть много …

2
Классификация с шумными метками?
Я пытаюсь обучить нейронную сеть для классификации, но у меня довольно шумные ярлыки (около 30% ярлыков ошибочны). Потеря перекрестной энтропии действительно работает, но мне было интересно, есть ли альтернативы, более эффективные в этом случае? или потеря кросс-энтропии является оптимальной? Я не уверен, но я думаю о некоторой «отсечке» кросс-энтропийной потери, …

3
Может ли нейронная сеть (например, сверточная нейронная сеть) иметь отрицательные веса?
Можно ли иметь отрицательные веса (после достаточного количества эпох) для глубоких сверточных нейронных сетей, когда мы используем ReLU для всех уровней активации?

5
Существует ли визуальный инструмент для проектирования и применения нейронных сетей / глубокого обучения? [закрыто]
Закрыто. Этот вопрос не по теме . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме перекрестной проверки. Закрыт 10 месяцев назад . Я знаю, что есть много библиотек для машинного обучения и глубокого обучения, таких как caffe, Theano, TensorFlow, keras, ... …

1
Матричная форма обратного распространения с нормализацией партии
Нормализация партии была приписана существенным улучшениям производительности в глубоких нейронных сетях. Много материала в интернете показывает, как реализовать его на основе активации за активацию. Я уже реализовал backprop, используя матричную алгебру, и учитывая, что я работаю на языках высокого уровня (полагаясь Rcpp(и, в конечном итоге, на GPU) на плотное матричное …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.