Вопросы с тегом «tensorflow»

TensorFlow - это библиотека с открытым исходным кодом для машинного обучения и искусственного интеллекта. TensorFlow использует графы потоков данных с тензорами, проходящими по краям. Для получения дополнительной информации см. Https://www.tensorflow.org. TensorFlow выпускается под лицензией Apache 2.0.

5
Функция кросс-энтропийной ошибки в нейронных сетях
В MNIST для начинающих ML они определяют кросс-энтропию как Hy′(y):=−∑iy′ilog(yi)Hy′(y):=−∑iyi′log⁡(yi)H_{y'} (y) := - \sum_{i} y_{i}' \log (y_i) yiyiy_i - это прогнозируемое значение вероятности для классаiii аy′iyi′y_i' - истинная вероятность для этого класса. Вопрос 1 Разве это не проблема, что yiyiy_i (в log(yi)log⁡(yi)\log(y_i) ) может быть 0? Это означало бы, что …

5
Нейронные сети: какую функцию стоимости использовать?
Я использую TensorFlow для экспериментов в основном с нейронными сетями. Хотя я провел довольно много экспериментов (XOR-Problem, MNIST, некоторые вещи регрессии, ...), я борюсь с выбором «правильной» функции стоимости для конкретных задач, потому что в целом я мог бы считаться новичком. До прихода в TensorFlow я самостоятельно кодировал некоторые полностью …

3
Multi GPU в керасе
Как вы можете программировать в библиотеке keras (или тензорном потоке), чтобы разделить обучение на несколько графических процессоров? Допустим, вы находитесь в экземпляре Amazon ec2 с 8 графическими процессорами, и вы хотели бы использовать их все для ускорения обучения, но ваш код предназначен только для одного процессора или графического процессора.

4
Интуитивно понятное объяснение потери шумовой контрастной оценки (NCE)?
Я читал о NCE (форма выборки кандидатов) из этих двух источников: Тензор потока записи Оригинальная бумага Может ли кто-нибудь помочь мне со следующим: Простое объяснение того, как работает NCE (я обнаружил, что вышеизложенное трудно разобрать и понять, поэтому что-то интуитивное, что приводит к представленной здесь математике, было бы здорово) После …

1
PyTorch против Tensorflow Fold
Как PyTorch, так и Tensorflow Fold являются средами глубокого обучения, предназначенными для работы в ситуациях, когда входные данные имеют неодинаковую длину или измерения (то есть ситуации, когда динамические графики полезны или необходимы). Я хотел бы знать, как они сравниваются, в смысле парадигм, на которые они полагаются (например, динамическое пакетирование), и …

2
Слияние двух разных моделей в Керасе
Я пытаюсь объединить две модели Keras в одну модель и не могу этого сделать. Например, на прилагаемом рисунке я хотел бы получить средний слой измерения 8 и использовать его в качестве входных данных для слоя (снова размера 8) в модели а затем объединить и модель и модель как один модель.А …

3
Нейронная сеть для множественной выходной регрессии
У меня есть набор данных, содержащий 34 входных столбца и 8 выходных столбцов. Один из способов решения этой проблемы - взять 34 входа и построить индивидуальную модель регрессии для каждого выходного столбца. Мне интересно, если эта проблема может быть решена с помощью только одной модели, особенно с помощью нейронной сети. …

2
Выбор между TensorFlow или Theano в качестве бэкэнда для Keras
Keras поддерживает как TensorFlow, так и Theano в качестве бэкенда: каковы плюсы / минусы выбора одного против другого, кроме того факта, что в настоящее время не все операции реализованы с бэкэндом TensorFlow?

3
Извлечение ключевого слова / фразы из текста с использованием библиотек Deep Learning
Возможно, это слишком широко, но я ищу ссылки на то, как использовать глубокое обучение в задаче обобщения текста. Я уже реализовал суммирование текста, используя стандартные частотно-частотные подходы и ранжирование предложений, но я хотел бы изучить возможность использования методов глубокого обучения для этой задачи. Я также рассмотрел некоторые реализации, представленные на …

2
Керас против тф.керас
Я немного запутался в выборе между Keras (keras-team / keras) и tf.keras (tenorflow / tenorflow / python / keras /) для моего нового исследовательского проекта. Существует дискуссия о том, что Keras не принадлежит никому, поэтому люди будут рады внести свой вклад, и в будущем будет намного легче управлять проектом. С …

4
Использование TensorFlow с Intel GPU
Я новичок в углубленном изучении. Есть ли способ использовать TensorFlow с графическими процессорами Intel? Если да, пожалуйста, укажите мне в правильном направлении. Если нет, пожалуйста, дайте мне знать, какую платформу (Keras, Theano и т. Д.) Можно использовать для моего интегрированного графического контроллера Intel Core Xeon E3-1200 v3 / 4-го поколения.
20 tensorflow  keras  theano  gpu 

4
Что означает «Количество единиц в ячейке LSTM»?
Из кода Tensorflow : Tensorflow. RnnCell. num_units: int, The number of units in the LSTM cell. Не могу понять, что это значит. Каковы единицы измерения ячейки LSTM. Вход, выход и забыть ворота? Означает ли это «количество единиц в текущем проекционном слое для Deep LSTM». Тогда почему это называется «количество единиц …

1
Как бороться с строковыми метками в мультиклассовой классификации с керасом?
Я новичок в области машинного обучения и кера, и сейчас я занимаюсь многоклассовой классификацией изображений с помощью кера. На входе помечено изображение. После некоторой предварительной обработки данные обучения представлены в списке Python как: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] «собака», «кошка» и «птица» являются метками класса. Я думаю, что для этой …

3
Как рассчитать влияние мини-партии памяти на тренировку моделей глубокого обучения?
Я пытаюсь вычислить объем памяти, необходимый графическому процессору для обучения моей модели, на основе этих заметок от Андрея Карфати: http://cs231n.github.io/convolutional-networks/#computational-considerations Моя сеть имеет 532 752 активаций и 19 072 984 параметров (весов и смещений). Все это 32-битные значения с плавающей запятой, поэтому каждое занимает 4 байта в памяти. Мое входное …

4
В чем преимущество разделения файла tfrecord на осколки?
Я работаю над распознаванием речи с Tensorflow и планирую тренировать LSTM NN с массивом массивных волн. Из-за увеличения производительности я планирую использовать tfrecords. В Интернете есть несколько примеров (Inception for ex.), Где файлы tfrecords разбиты на фрагменты. У меня такой вопрос: какая польза от использования файла tfrecords в шарды? Есть …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.