Вопросы с тегом «neural-network»

Сетевая структура вдохновлена ​​упрощенными моделями биологических нейронов (клеток мозга). Нейронные сети обучаются «обучению» с помощью контролируемых и неконтролируемых методов и могут использоваться для решения задач оптимизации, задач аппроксимации, классификации шаблонов и их комбинаций.

20
Какова роль смещения в нейронных сетях?
Я знаю о градиентном спуске и алгоритме обратного распространения. Чего я не понимаю, так это когда важно использовать предвзятость и как вы ее используете? Например, при отображении ANDфункции, когда я использую 2 входа и 1 выход, она не дает правильных весов, однако, когда я использую 3 входа (1 из которых …


6
Каковы преимущества искусственных нейронных сетей перед машинами опорных векторов? [закрыто]
В настоящее время этот вопрос не очень подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, вызовет дебаты, споры, опрос или расширенное обсуждение. Если вы считаете, что этот вопрос можно улучшить и, возможно, вновь открыть, обратитесь за …

2
Объяснение ввода Keras: input_shape, unit, batch_size, dim и т. Д.
Для любого слоя Keras ( Layerкласс), может кто - то объяснить , как понять разницу между input_shape, units, dimи т.д.? Например, в документе сказано unitsуказать форму вывода слоя. На изображении нейронной сети ниже hidden layer1имеется 4 единицы. Относится ли это непосредственно к unitsатрибуту Layerобъекта? Или unitsв Керасе форма каждого веса …

11
Что означает слово logits в TensorFlow?
В следующей функции TensorFlow мы должны обеспечить активацию искусственных нейронов в последнем слое. Это я понимаю. Но я не понимаю, почему это называется логитс? Разве это не математическая функция? loss_function = tf.nn.softmax_cross_entropy_with_logits( logits = last_layer, labels = target_output )

3
Как интерпретировать «потери» и «точность» для модели машинного обучения
Когда я тренировал свою нейронную сеть с помощью Theano или Tensorflow, они сообщали о переменной, называемой «потерями» за эпоху. Как я должен интерпретировать эту переменную? Чем выше потери, тем лучше или хуже, или что это значит для конечной производительности (точности) моей нейронной сети?

7
Где я могу вызвать функцию BatchNormalization в Keras?
Если я хочу использовать функцию BatchNormalization в Keras, то нужно ли вызывать ее один раз только в начале? Я прочитал эту документацию для этого: http://keras.io/layers/normalization/ Я не понимаю, где я должен это назвать. Ниже мой код пытается использовать его: model = Sequential() keras.layers.normalization.BatchNormalization(epsilon=1e-06, mode=0, momentum=0.9, weights=None) model.add(Dense(64, input_dim=14, init='uniform')) model.add(Activation('tanh')) …

9
Зачем использовать softmax вместо стандартной нормализации?
В выходном слое нейронной сети обычно используется функция softmax для аппроксимации распределения вероятностей: Это дорого вычислять из-за показателей. Почему бы просто не выполнить Z-преобразование, чтобы все выходы были положительными, а затем нормализовать, просто разделив все выходы на сумму всех выходов?

11
Почему двоичные_кросентропии и категориальные_кросентропии дают разные результаты для одной и той же проблемы?
Я пытаюсь обучить Си-Эн-Эн классифицировать текст по темам. Когда я использую двоичную кросс-энтропию, я получаю точность ~ 80%, с категориальной кросс-энтропией я получаю точность ~ 50%. Я не понимаю, почему это так. Это проблема мультикласса, не означает ли это, что я должен использовать категорическую перекрестную энтропию и что результаты с …

7
В чем разница между поездом, валидацией и тестовым набором в нейронных сетях?
Я использую эту библиотеку для реализации учебного агента. Я создал учебные примеры, но я не знаю точно, что такое наборы валидации и тестирования. Учитель говорит: 70% должны быть обучающими случаями, 10% будут контрольными случаями, а остальные 20% должны быть проверочными. редактировать У меня есть этот код для обучения, но я …

9
Почему мы должны нормализовать ввод для искусственной нейронной сети?
Это принципиальный вопрос, касающийся теории нейронных сетей: Почему мы должны нормализовать вход для нейронной сети? Я понимаю, что иногда, когда, например, входные значения не числовые, необходимо выполнить определенное преобразование, но когда у нас есть числовой ввод? Почему числа должны быть в определенном интервале? Что будет, если данные не нормализуются?

13
Почему необходимо использовать нелинейную функцию активации в нейронной сети обратного распространения? [закрыто]
Закрыто. Этот вопрос не соответствует рекомендациям по переполнению стека . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он соответствовал теме Stack Overflow. Закрыт 3 месяца назад . Уточните этот вопрос Я читал кое-что о нейронных сетях и понимаю общий принцип однослойной нейронной сети. …

8
Когда мне следует использовать генетические алгоритмы, а не нейронные сети? [закрыто]
В его нынешнем виде этот вопрос не подходит для нашего формата вопросов и ответов. Мы ожидаем, что ответы будут подтверждены фактами, ссылками или опытом, но этот вопрос, скорее всего, потребует дебатов, аргументов, опросов или расширенного обсуждения. Если вы считаете, что этот вопрос можно улучшить и, возможно, снова открыть, обратитесь за …

7
Как обучить искусственную нейронную сеть игре в Diablo 2 с помощью визуального ввода?
В настоящее время я пытаюсь получить ИНС для игры в видеоигру, и я надеялся получить некоторую помощь от замечательного сообщества здесь. Я остановился на Diablo 2. Таким образом, игра ведется в реальном времени с изометрической точки зрения, когда игрок управляет одним аватаром, на котором сфокусирована камера. Чтобы сделать вещи конкретными, …

5
Что делает tf.nn.conv2d в тензорном потоке?
Я просматривал документы по тензорному потоку tf.nn.conv2d здесь . Но я не могу понять, что он делает или чего пытается достичь. На документах сказано: # 1: Выравнивает фильтр в 2-D матрицу с формой [filter_height * filter_width * in_channels, output_channels], Что это делает? Это поэлементное умножение или просто умножение матриц? Я …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.