Наука о данных

2

Какие фильтры используются по умолчанию в Keras Convolution2d ()?

Я довольно плохо знаком с нейронными сетями, но я достаточно хорошо понимаю линейную алгебру и математику свертки. Я пытаюсь понять пример кода, который я нахожу в различных местах сети для обучения сверточного NN Keras с данными MNIST для распознавания цифр. Я ожидаю, что когда я создаю сверточный слой, мне нужно …

18 convnet keras

3

есть ли инструмент для очистки данных для python / pandas, похожий на инструмент R tidyr?

Я работаю над проблемой Kaggle, где некоторые переменные представлены строками, а не столбцами (разрушение сети Telstra). В настоящее время я ищу эквивалент функции collect (), separa (() и spread (), который можно найти в инструменте R tidyr.

18 r python dataset data-cleaning pandas

3

Руководство по выбору оптимизатора для обучения нейронных сетей

Я использую нейронные сети уже некоторое время. Тем не менее, одна вещь, с которой я постоянно борюсь, это выбор оптимизатора для обучения сети (используя backprop). Что я обычно делаю, так это просто начинаю с одного (например, стандартного SGD), а затем пробую другие другие довольно случайно. Мне было интересно, есть ли …

18 neural-network optimization backpropagation

4

В чем разница между Inception v2 и Inception v3?

В статье « Пройдя глубже с извилинами» описывается GoogleNet, в которой содержатся оригинальные начальные модули: Переход к началу v2 заключался в том, что они заменили свертки 5x5 на две последовательные свертки 3x3 и применили объединение: В чем разница между Inception v2 и Inception v3?

18 image-classification convnet computer-vision inception

7

Как я могу прогнозировать трафик на основе данных предыдущих временных рядов?

Если у меня есть магазин розничной торговли, и у меня есть способ измерить, сколько людей заходит в мой магазин каждую минуту, и поставить отметку времени в этих данных, как я могу прогнозировать будущий объем трафика? Я изучил алгоритмы машинного обучения, но не уверен, какой из них использовать. В моих тестовых …

18 machine-learning time-series

4

Поиск гиперпараметра для LSTM-RNN с использованием Keras (Python)

Из Keras RNN Tutorial: «RNNs сложны. Выбор размера пакета важен, выбор потерь и оптимизатора важен и т. Д. Некоторые конфигурации не сходятся». Так что это более общий вопрос о настройке гиперпараметров LSTM-RNN на Keras. Я хотел бы знать о подходе к поиску лучших параметров для вашего RNN. Я начал с …

18 python neural-network deep-learning keras hyperparameter

3

Функция извлечения изображений в Python

В моем классе я должен создать приложение, используя два классификатора, чтобы решить, является ли объект на изображении примером phylum porifera (seasponge) или каким-либо другим объектом. Тем не менее, я полностью растерялся, когда дело доходит до методов извлечения функций в Python. Мой советник убедил меня использовать изображения, которые не были рассмотрены …

18 python feature-extraction image-recognition

5

Лучший практический алгоритм для сходства предложений

У меня есть два предложения, S1 и S2, оба из которых имеют количество слов (обычно) ниже 15. Каковы наиболее практичные и успешные (машинное обучение) алгоритмы, которые, возможно, легко реализовать (нейронная сеть в порядке, если архитектура не такая сложная, как Google Inception и т. Д.). Я ищу алгоритм, который будет работать …

18 nlp clustering word2vec similarity

1

НЛП - почему «не» стоп-слово?

Я пытаюсь удалить стоп-слова перед выполнением моделирования темы. Я заметил, что некоторые слова отрицания (ни, ни, никогда, ни и т.д. ...) обычно считаются стоп-словами. Например, NLTK, spacy и sklearn включают «not» в свои списки стоп-слов. Однако, если мы уберем «не» из этих предложений ниже, они потеряют значимое значение, и это …

18 nlp topic-model sentiment-analysis

2

локальные минимумы против седловых точек в глубоком обучении

Я слышал, как Эндрю Нг (в видео, которое я, к сожалению, больше не могу найти) рассказывал о том, как изменилось понимание локальных минимумов в задачах глубокого обучения в том смысле, что они теперь рассматриваются как менее проблемные, поскольку в многомерных пространствах (встречающихся в глубокое обучение) критические точки, скорее всего, будут …

18 machine-learning deep-learning optimization convergence

4

Повышение скорости реализации t-sne в python для больших данных

Я хотел бы уменьшить размерность почти на 1 миллион векторов с 200 измерениями ( doc2vec). Я использую TSNEреализацию из sklearn.manifoldмодуля, и главная проблема - временная сложность. Даже при том method = barnes_hut, что скорость вычислений все еще низка. Некоторое время даже не хватает памяти. Я использую его на 48-ядерном процессоре …

18 python bigdata nlp scikit-learn dimensionality-reduction

4

Кластеризация на основе показателей сходства

Предположим , что мы имеем множество элементов Е и сходство ( не расстояние ) функция сим (е, Ej) между двумя элементами Ei, Ej ∈ E . Как мы можем (эффективно) кластеризовать элементы E , используя sim ? к -средних, например, требует заданных к , Навес Кластеризация требует два пороговых значений. …

18 clustering algorithms similarity

2

Что такое активация GELU?

Я просматривал статью BERT, в которой используется GELU (линейная единица гауссовой ошибки), в которой уравнение имеет вид что, в свою очередь, приближается кGELU(x)=xP(X≤x)=xΦ(x).GELU(x)=xP(X≤x)=xΦ(x). GELU(x) = xP(X ≤ x) = xΦ(x).0.5x(1+tanh[2/π−−−√(x+0.044715x3)])0.5x(1+tanh[2/π(x+0.044715x3)])0.5x(1 + tanh[\sqrt{ 2/π}(x + 0.044715x^3)]) Не могли бы вы упростить уравнение и объяснить, как оно было аппроксимировано.

18 activation-function bert mathematics

4

Ролевая производная сигмоидальной функции в нейронных сетях

Я пытаюсь понять роль производной сигмовидной функции в нейронных сетях. Сначала я строю сигмовидную функцию и производную всех точек из определения, используя python. Какова роль этой производной? import numpy as np import matplotlib.pyplot as plt def sigmoid(x): return 1 / (1 + np.exp(-x)) def derivative(x, step): return (sigmoid(x+step) - sigmoid(x)) …

18 machine-learning neural-network

1

Керас разница между val_loss и потерей во время тренировки

В чем разница между тренировками в Керасе val_lossи lossво время них? Например Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 На некоторых сайтах я читал, что при проверке не работал отсев.

18 machine-learning deep-learning keras