Вопросы с тегом «neural-network»

Искусственные нейронные сети (ANN) состоят из «нейронов» - программных конструкций, которые имитируют свойства биологических нейронов. Набор взвешенных связей между нейронами позволяет распространять информацию по сети для решения проблем искусственного интеллекта, при этом у сетевого разработчика не было модели реальной системы.

4
Word2Vec для распознавания именованных объектов
Я собираюсь использовать реализацию word2vec от Google для создания системы распознавания именованных сущностей. Я слышал, что рекурсивные нейронные сети с обратным распространением через структуру хорошо подходят для задач распознавания именованных сущностей, но я не смог найти достойную реализацию или подходящее руководство для этого типа модели. Поскольку я работаю с нетипичным …

3
Почему сообщества НЛП и машинного обучения заинтересованы в глубоком обучении?
Я надеюсь, что вы можете мне помочь, так как у меня есть несколько вопросов на эту тему. Я новичок в области глубокого обучения, и хотя я сделал несколько уроков, я не могу связать или отличить понятия друг от друга.

3
В чем разница между градиентным спуском и стохастическим градиентным спуском?
В чем разница между градиентным спуском и стохастическим градиентным спуском? Я не очень знаком с ними, можете ли вы описать разницу с помощью короткого примера?

6
Почему сверточные нейронные сети работают?
Я часто слышал, как люди говорили, почему сверточные нейронные сети все еще плохо поняты. Известно ли, почему сверточные нейронные сети всегда заканчивают тем, что изучают все более сложные функции, когда мы поднимаемся по уровням? Что заставило их создать такой набор функций, и будет ли это также верно для других типов …

2
Как рассчитать mAP для задачи обнаружения для PASCAL VOC Challenge?
Как рассчитать mAP (среднее значение точности) для задачи обнаружения для таблиц лидеров Vascal Pascal? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Там сказано - на странице 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Средняя точность (AP). Для задачи VOC2007 интерполированная средняя точность (Salton and Mcgill 1986) использовалась для оценки как классификации, так и обнаружения. Для заданной задачи и класса кривая …

1
Существуют ли правила выбора размера мини-партии?
При обучении нейронных сетей одним гиперпараметром является размер мини-пакета. Обычный выбор - 32, 64 и 128 элементов в каждой партии. Существуют ли какие-либо правила / рекомендации, какими большими должны быть мини-партии? Какие-нибудь публикации, которые исследуют влияние на обучение?

3
Нейронная сеть для множественной выходной регрессии
У меня есть набор данных, содержащий 34 входных столбца и 8 выходных столбцов. Один из способов решения этой проблемы - взять 34 входа и построить индивидуальную модель регрессии для каждого выходного столбца. Мне интересно, если эта проблема может быть решена с помощью только одной модели, особенно с помощью нейронной сети. …

4
Всегда ли градиентный спуск сходится к оптимальному?
Мне интересно, есть ли сценарий, при котором градиентный спуск не сходится к минимуму. Я осознаю, что градиентный спуск не всегда может привести к глобальному оптимуму. Я также знаю, что он может отличаться от оптимального, если, скажем, размер шага слишком велик. Тем не менее, мне кажется, что если он отклоняется от …

4
Как получить точность, F1, точность и отзыв, для модели Keras?
Я хочу вычислить точность, отзыв и оценку F1 для моей двоичной модели KerasClassifier, но не нашел никакого решения. Вот мой фактический код: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() model.add(Dense(23, input_dim=45, kernel_initializer='normal', activation='relu')) …

2
Выбор между TensorFlow или Theano в качестве бэкэнда для Keras
Keras поддерживает как TensorFlow, так и Theano в качестве бэкенда: каковы плюсы / минусы выбора одного против другого, кроме того факта, что в настоящее время не все операции реализованы с бэкэндом TensorFlow?

3
Извлечение ключевого слова / фразы из текста с использованием библиотек Deep Learning
Возможно, это слишком широко, но я ищу ссылки на то, как использовать глубокое обучение в задаче обобщения текста. Я уже реализовал суммирование текста, используя стандартные частотно-частотные подходы и ранжирование предложений, но я хотел бы изучить возможность использования методов глубокого обучения для этой задачи. Я также рассмотрел некоторые реализации, представленные на …

2
Sparse_categorical_crossentropy vs категорическая_кросентропия (керас, точность)
Что лучше для точности или они одинаковые? Конечно, если вы используете categoryorical_crossentropy, вы используете одну горячую кодировку, а если вы используете sparse_categorical_crossentropy, вы кодируете как обычные целые числа. Кроме того, когда один лучше другого?

2
Почему ReLU используется в качестве функции активации?
Функции активации используются для введения нелинейностей в линейный вывод типа w * x + bв нейронной сети. Что я могу понять интуитивно для функций активации, таких как сигмоидальные. Я понимаю преимущества ReLU, который избегает мертвых нейронов во время обратного распространения. Однако я не могу понять, почему ReLU используется в качестве …

4
Что означает «Количество единиц в ячейке LSTM»?
Из кода Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Не могу понять, что это значит. Каковы единицы измерения ячейки LSTM. Вход, выход и забыть ворота? Означает ли это «количество единиц в текущем проекционном слое для Deep LSTM». Тогда почему это называется «количество единиц …

1
Как определить архитектуру нейронной сети?
Мне было интересно, как мы должны решить, сколько узлов в скрытых слоях и сколько скрытых слоев разместить при построении архитектуры нейронной сети. Я понимаю, что уровень ввода и вывода зависит от имеющегося у нас обучающего набора, но как нам определить скрытый уровень и общую архитектуру в целом?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.