Вопросы с тегом «deep-learning»

новая область исследований в области машинного обучения, связанная с технологиями, используемыми для изучения иерархического представления данных, в основном с глубокими нейронными сетями (т. е. с двумя или более скрытыми слоями), а также с какими-то вероятностными графическими моделями.

3
Multi GPU в керасе
Как вы можете программировать в библиотеке keras (или тензорном потоке), чтобы разделить обучение на несколько графических процессоров? Допустим, вы находитесь в экземпляре Amazon ec2 с 8 графическими процессорами, и вы хотели бы использовать их все для ускорения обучения, но ваш код предназначен только для одного процессора или графического процессора.

4
Интуитивно понятное объяснение потери шумовой контрастной оценки (NCE)?
Я читал о NCE (форма выборки кандидатов) из этих двух источников: Тензор потока записи Оригинальная бумага Может ли кто-нибудь помочь мне со следующим: Простое объяснение того, как работает NCE (я обнаружил, что вышеизложенное трудно разобрать и понять, поэтому что-то интуитивное, что приводит к представленной здесь математике, было бы здорово) После …

1
Статья. В чем разница между нормализацией слоев, периодической нормализацией партии (2016 г.) и нормализованной партией RNN (2015 г.)?
Итак, недавно появилась статья о нормализации слоя . Есть также реализация этого на Керасе. Но я помню, что есть статьи под названием Рекуррентная пакетная нормализация (Cooijmans, 2016) и Пакетная нормализованная рекуррентная нейронная сеть (Laurent, 2015). В чем разница между этими тремя? Есть раздел «Связанные работы», который я не понимаю: Пакетная …

5
Глубокое обучение против повышения градиента: когда и что использовать?
У меня проблема с большими данными с большим набором данных (например, 50 миллионов строк и 200 столбцов). Набор данных состоит из около 100 числовых столбцов и 100 категориальных столбцов и столбца ответов, представляющего проблему двоичного класса. Мощность каждого из категориальных столбцов составляет менее 50. Я хочу знать априори, должен ли …

3
В классификаторе softmax зачем использовать функцию exp для нормализации?
Зачем использовать softmax вместо стандартной нормализации? В области комментариев верхнего ответа на этот вопрос @Kilian Batzner поднял 2 вопроса, которые также очень меня смущают. Кажется, никто не дает объяснения, кроме численных преимуществ. Я понимаю причины использования Cross-Entropy Loss, но как это связано с softmax? Вы сказали, что «функция softmax может …

7
Почему данные должны быть перетасованы для задач машинного обучения
В задачах машинного обучения обычно перетасовывать данные и нормализовать их. Цель нормализации ясна (для того же диапазона значений признаков). Но после долгих попыток я не нашел какой-либо ценной причины для перетасовки данных. Я прочитал этот пост здесь, обсуждая, когда мы должны перетасовать данные, но не очевидно, почему мы должны перетасовывать …

2
Что такое наземная истина
В контексте машинного обучения я часто видел термин « Основополагающая истина» . Я много искал и нашел следующее определение в Википедии : В машинном обучении термин «наземная истина» относится к точности классификации учебного набора для контролируемых методов обучения. Это используется в статистических моделях для подтверждения или опровержения гипотез исследования. Термин …

1
Почему xgboost намного быстрее, чем sklearn GradientBoostingClassifier?
Я пытаюсь обучить модели повышения градиента более чем на 50 тыс. Примеров с 100 числовыми функциями. XGBClassifierобрабатывает 500 деревьев в течение 43 секунд на моей машине, в то время как GradientBoostingClassifierобрабатывает только 10 деревьев (!) за 1 минуту и ​​2 секунды :( Я не стал пытаться вырастить 500 деревьев, так …
29 scikit-learn  xgboost  gbm  data-mining  classification  data-cleaning  machine-learning  reinforcement-learning  data-mining  bigdata  dataset  nlp  language-model  stanford-nlp  machine-learning  neural-network  deep-learning  randomized-algorithms  machine-learning  beginner  career  xgboost  loss-function  neural-network  software-recommendation  naive-bayes-classifier  classification  scikit-learn  feature-selection  r  random-forest  cross-validation  data-mining  python  scikit-learn  random-forest  churn  python  clustering  k-means  machine-learning  nlp  sentiment-analysis  machine-learning  programming  python  scikit-learn  nltk  gensim  visualization  data  csv  neural-network  deep-learning  descriptive-statistics  machine-learning  supervised-learning  text-mining  orange  data  parameter-estimation  python  pandas  scraping  r  clustering  k-means  unsupervised-learning 

3
Выбор между CPU и GPU для обучения нейронной сети
Я видел дискуссии о «накладных расходах» графического процессора и о том, что для «небольших» сетей обучение на процессоре (или сети процессоров) может быть быстрее, чем на графическом процессоре. Что означает «маленький»? Например, будет ли «однослойный» MLP со 100 скрытыми единицами «маленьким»? Меняется ли наше определение «малого» для рекуррентных архитектур? Есть …

7
Существуют ли бесплатные облачные сервисы для обучения моделям машинного обучения?
Я хочу тренировать глубокую модель с большим количеством обучающих данных, но мой рабочий стол не имеет такой силы, чтобы тренировать такую ​​глубокую модель с этими обильными данными. Я хотел бы знать, существуют ли какие-либо бесплатные облачные сервисы, которые можно использовать для обучения машинному обучению и моделям глубокого обучения? Я также …

1
Как Keras рассчитывает точность?
Как Keras рассчитывает точность по классовым вероятностям? Например, у нас есть 100 образцов в тестовом наборе, которые могут принадлежать одному из двух классов. У нас также есть список классовых вероятностей. Какой порог использует Keras, чтобы назначить выборку любому из двух классов?

1
PyTorch против Tensorflow Fold
Как PyTorch, так и Tensorflow Fold являются средами глубокого обучения, предназначенными для работы в ситуациях, когда входные данные имеют неодинаковую длину или измерения (то есть ситуации, когда динамические графики полезны или необходимы). Я хотел бы знать, как они сравниваются, в смысле парадигм, на которые они полагаются (например, динамическое пакетирование), и …

7
Может ли машинное обучение выучить такую ​​функцию, как поиск максимума из списка?
У меня есть вход, который является списком, и вывод является максимумом элементов input-list. Может ли машинное обучение выучить такую ​​функцию, которая всегда выбирает максимум входных элементов, присутствующих на входе? Это может показаться довольно простым вопросом, но он может дать мне понимание того, что машинное обучение может делать в целом. Благодарность!

5
Как установить количество нейронов и слоев в нейронных сетях
Я новичок в нейронных сетях, и мне было трудно понять две концепции: Как определить количество средних слоев в данной нейронной сети? 1 против 10 или что-то еще. Как определить количество нейронов в каждом среднем слое? Рекомендуется ли иметь одинаковое количество нейронов в каждом среднем слое или это зависит от применения?

2
Слияние двух разных моделей в Керасе
Я пытаюсь объединить две модели Keras в одну модель и не могу этого сделать. Например, на прилагаемом рисунке я хотел бы получить средний слой измерения 8 и использовать его в качестве входных данных для слоя (снова размера 8) в модели а затем объединить и модель и модель как один модель.А …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.