Вопросы с тегом «neural-network»

Искусственные нейронные сети (ANN) состоят из «нейронов» - программных конструкций, которые имитируют свойства биологических нейронов. Набор взвешенных связей между нейронами позволяет распространять информацию по сети для решения проблем искусственного интеллекта, при этом у сетевого разработчика не было модели реальной системы.

1
Изменение формы данных для глубокого обучения с использованием Keras
Я новичок в Keras, и я начал с примера MNIST, чтобы понять, как на самом деле работает библиотека. Фрагмент кода проблемы MNIST в папке примера Keras имеет вид: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, …

1
Text-Classification-Problem: Word2Vec / NN - лучший подход?
Я рассчитываю разработать систему, которая с учетом абзаца текста сможет классифицировать его и определить контекст: Обучается с пользовательскими текстовыми параграфами (например, комментарии / вопросы / ответы) Каждый элемент в обучающем наборе будет помечен. Так, например, («категория 1», «текстовый абзац») Там будут сотни категорий Каков наилучший подход к созданию такой системы? …

2
Как ИИ учатся действовать, когда проблемное пространство слишком велико
Я учусь лучше всего через эксперименты и пример. Я изучаю нейронные сети, и у меня есть (что я думаю) довольно хорошее понимание классификации и регрессии, а также обучения под наблюдением и без него, но я наткнулся на то, чего не могу понять; Если бы я хотел обучить ИИ играть в …

1
Преобразование автоэнкодеров
Я только что прочитал статью Джеффа Хинтона о преобразовании автоэнкодеров Хинтон, Крижевский и Ван: Преобразование авто-кодировщиков . В искусственных нейронных сетях и машинном обучении, 2011. и очень хотел бы поиграть с чем-то вроде этого. Но, прочитав его, я не смог получить достаточно подробностей из статьи о том, как я мог …

5
LSTM или другой пакет RNN для R
Я видел впечатляющий результат от моделей LSTM, производящих тексты, подобные Шекспиру. Мне было интересно, существует ли пакет LSTM для R. Я гуглил его, но нашел только пакеты для Python и Julia. (возможно, есть некоторая проблема с производительностью, которая объясняет, почему эти программы более предпочтительны, чем R). Знаете ли вы о …
10 r  neural-network  rnn 

2
Прогнозирование валютного рынка с помощью нейронных сетей
Я хотел бы использовать ANN для автоматизации торговли валютами, предпочтительно USD / EUR или USD / GBP. Я знаю, что это сложно и, возможно, не так просто. Я уже прочитал несколько статей и провел несколько экспериментов, но без особой удачи. Я хотел бы получить совет от экспертов, чтобы сделать эту …

4
Обнаружение выбросов газа - проект нейронной сети. Плохие результаты
Я попытался обнаружить выбросы в потреблении энергетического газа в некоторых голландских зданиях, построив модель нейронной сети. У меня очень плохие результаты, но я не могу найти причину. Я не эксперт, поэтому я хотел бы спросить вас, что я могу улучшить и что я делаю неправильно. Это полное описание: https://github.com/denadai2/Gas-consuming-outliers . …

2
Каковы различия между Convolutional1D, Convolutional2D и Convolutional3D?
Я узнал о сверточных нейронных сетях. При рассмотрении Kerasпримеров я натолкнулся на три различных метода свертки. А именно, 1D, 2D & 3D. Каковы различия между этими тремя слоями? Каковы их варианты использования? Есть ли ссылки или ссылки, чтобы показать их варианты использования?

2
Что такое матрица функций в word2vec?
Я новичок в нейронных сетях, и в настоящее время я изучаю модель word2vec. Однако мне трудно понять, что такое матрица функций. Я могу понять, что первая матрица является горячим вектором кодирования для данного слова, но что означает вторая матрица? Более конкретно, что означает каждое из этих значений (то есть 17, …

1
Почему TensorFlow не может соответствовать простой линейной модели, если я минимизирую абсолютную среднюю ошибку вместо среднеквадратичной ошибки?
Во введении я только что изменился loss = tf.reduce_mean(tf.square(y - y_data)) в loss = tf.reduce_mean(tf.abs(y - y_data)) и модель не в состоянии узнать, потеря только стала больше со временем. Почему?

2
Как нормализовать данные для нейронной сети и леса принятия решений
У меня есть набор данных с 20000 сэмплами, каждый имеет 12 различных функций. Каждая выборка относится к категории 0 или 1. Я хочу обучить нейронную сеть и лес решений для классификации выборок, чтобы можно было сравнить результаты и оба метода. Первое, на что я наткнулся, это правильная нормализация данных. Одна …

1
КАК: Инициализация веса глубоких нейронных сетей
Учитывая сложную задачу обучения (например, высокую размерность, сложность данных), глубокие нейронные сети становятся сложными для обучения. Чтобы облегчить многие из проблем, можно: Нормализовать && данные качества отобранных вручную выберите другой алгоритм обучения (например, RMSprop вместо Gradient Descent) выберите функцию более крутого градиента стоимости (например, перекрестная энтропия вместо MSE) Используйте другую …

1
Насколько гибка связь между целевой функцией и функцией активации выходного слоя?
Во многих пакетах нейронных сетей кажется стандартным объединение целевой функции, которая должна быть минимизирована, с функцией активации в выходном слое. Например, для линейного выходного слоя, используемого для регрессии, является стандартным (и часто единственным выбором) иметь целевую функцию квадрата ошибки. Другим обычным сопряжением является логистический вывод и потери в журнале (или …

1
Как рассчитать дельта-член сверточного слоя, учитывая дельта-члены и веса предыдущего сверточного слоя?
Я пытаюсь обучить искусственную нейронную сеть с двумя сверточными слоями (с1, с2) и двумя скрытыми слоями (с1, с2). Я использую стандартный подход обратного распространения. При обратном проходе я вычисляю член ошибки слоя (дельта) на основе ошибки предыдущего слоя, весов предыдущего слоя и градиента активации относительно функции активации текущего слоя. Более …

2
Отладка нейронных сетей
Я построил искусственную нейронную сеть в Python, используя функцию оптимизации scipy.optimize.minimize (Conjugate Gradient). Я реализовал проверку градиента, дважды проверил все и т.д., и я уверен, что он работает правильно. Я запускал его несколько раз, и он достигает «Оптимизация успешно завершена», однако, когда я увеличиваю количество скрытых слоев, стоимость гипотезы увеличивается …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.