Наука о данных

1

Как работает параметр validation_split функции подбора Keras?

Разделение валидации в Keras Последовательная функция подбора модели документирована следующим образом на https://keras.io/models/sequential/ : validation_split: с плавающей точкой от 0 до 1. Доля данных обучения, которые будут использоваться в качестве данных проверки. Модель выделит эту часть обучающих данных, не будет обучаться им и будет оценивать потери и любые метрики модели …

17 keras data cross-validation

2

Зачем использовать набор проверки и набор тестов?

Рассмотрим нейронную сеть: Для данного набора данных мы делим его на наборы для обучения, проверки и тестирования. Предположим, что мы делаем это в классическом соотношении 60:20:20, тогда мы предотвращаем переобучение, проверяя сеть, проверяя ее на наборе проверки. Тогда зачем тестировать его на тестовом наборе, чтобы проверить его работоспособность? Не будет …

17 machine-learning neural-network cross-validation

4

Какие-нибудь «практические правила» в отношении количества функций в зависимости от количества экземпляров? (небольшие наборы данных)

Мне интересно, есть ли какие-либо эвристики по количеству признаков и количеству наблюдений. Очевидно, что если число признаков равно количеству наблюдений, модель будет соответствовать. Используя разреженные методы (LASSO, эластичная сетка), мы можем удалить несколько функций, чтобы уменьшить модель. Мой вопрос (теоретически): прежде чем использовать метрики для оценки выбора модели, существуют ли …

17 feature-selection model-selection

3

Как рассчитать влияние мини-партии памяти на тренировку моделей глубокого обучения?

Я пытаюсь вычислить объем памяти, необходимый графическому процессору для обучения моей модели, на основе этих заметок от Андрея Карфати: http://cs231n.github.io/convolutional-networks/#computational-considerations Моя сеть имеет 532 752 активаций и 19 072 984 параметров (весов и смещений). Все это 32-битные значения с плавающей запятой, поэтому каждое занимает 4 байта в памяти. Мое входное …

17 deep-learning tensorflow

5

Выберите алгоритм двоичной классификации

У меня есть проблема двоичной классификации: Примерно 1000 образцов в тренировочном наборе 10 атрибутов, включая двоичные, числовые и категориальные Какой алгоритм является лучшим выбором для этого типа проблемы? По умолчанию я собираюсь начать с SVM (предварительно имея номинальные значения атрибутов, преобразованные в двоичные объекты), поскольку он считается лучшим для относительно …

17 classification binary svm random-forest logistic-regression

1

Глубокая нейронная сеть - обратная связь с ReLU

У меня есть некоторые трудности с получением обратного распространения с помощью ReLU, и я проделал некоторую работу, но я не уверен, что я на правильном пути. Функция стоимости: 12(y−y^)212(y−y^)2\frac{1}{2}(y-\hat y)^2гдеyyyпредставляет собой реальное значение, и у представляет собой предсказанное значение. Также предположим, чтоx> 0 всегда.y^y^\hat yxxx 1 слой ReLU, где вес …

17 neural-network backpropagation

4

В чем преимущество разделения файла tfrecord на осколки?

Я работаю над распознаванием речи с Tensorflow и планирую тренировать LSTM NN с массивом массивных волн. Из-за увеличения производительности я планирую использовать tfrecords. В Интернете есть несколько примеров (Inception for ex.), Где файлы tfrecords разбиты на фрагменты. У меня такой вопрос: какая польза от использования файла tfrecords в шарды? Есть …

17 python tensorflow

5

Объединение разреженных и плотных данных в машинном обучении для повышения производительности

У меня есть редкие признаки, которые являются прогнозирующими, также у меня есть некоторые плотные признаки, которые также являются прогнозирующими. Мне нужно объединить эти функции вместе, чтобы улучшить общую производительность классификатора. Дело в том, что когда я пытаюсь объединить их вместе, плотные функции имеют тенденцию доминировать в большей степени, чем разреженные, …

17 machine-learning classification predictive-modeling scikit-learn supervised-learning

2

Должны ли мы применять нормализацию и к тестовым данным?

Я делаю проект по проблеме идентификации автора. Я применил нормализацию tf-idf для обучения данных, а затем обучил SVM на этих данных. Теперь при использовании классификатора я должен также нормализовать тестовые данные. Я чувствую, что основная цель нормализации - сделать так, чтобы обучающий алгоритм придавал больший вес более важным функциям во …

17 machine-learning neural-network deep-learning

3

Ищете хороший пакет для обнаружения аномалий во временных рядах

Существует ли комплексный пакет с открытым исходным кодом (предпочтительно на python или R), который можно использовать для обнаружения аномалий во временных рядах? В scikit-learn есть один класс SVM-пакета, но он не предназначен для данных временных рядов. Я ищу более сложные пакеты, которые, например, используют байесовские сети для обнаружения аномалий.

17 python time-series anomaly-detection

2

Пример Keras Callback для сохранения модели после каждой эпохи?

Может кто-нибудь опубликовать простой пример использования Keras обратного вызова для сохранения модели после каждой эпохи? Я могу найти примеры экономии веса, но я хочу иметь возможность сохранять полностью функционирующую модель после каждой тренировочной эпохи.

17 python keras

8

Как посчитать количество пропущенных значений в каждой строке в кадре данных Pandas?

Как я могу получить число недостающего значения в каждой строке в панде dataframe. Я хотел бы разделить фреймы данных на различные фреймы данных, которые имеют одинаковое количество пропущенных значений в каждой строке. Любое предложение?

17 python pandas

2

Где в рабочем процессе мы должны иметь дело с отсутствующими данными?

Я строю рабочий процесс для создания моделей машинного обучения (в моем случае, с использованием Python pandasи sklearnпакетов) из данных, извлеченных из очень большой базы данных (здесь, Vertica посредством SQL и pyodbc), и критический шаг в этом процессе включает в себя отсутствие значения предикторов. Это просто в рамках единой платформы аналитики …

16 machine-learning python pandas scikit-learn

5

Что еще TensorFlow предлагает керасам?

Мне известно, что керас служит высокоуровневым интерфейсом для TensorFlow. Но мне кажется, что keras может выполнять множество функций самостоятельно (ввод данных, создание моделей, обучение, оценка). Кроме того, некоторые функции TensorFlow могут быть перенесены непосредственно на кера (например, можно использовать метрику tf или функцию потерь в кера). Мой вопрос: что предлагает …

16 keras tensorflow

1

Что такое оценка LB в машинном обучении?

Я просматривал статью в блогах Kaggle. Неоднократно автор упоминает «оценку LB» и «соответствие LB») в качестве показателя эффективности машинного обучения (наряду с оценкой перекрестной проверки (CV)). С исследованием значения «LB» я потратил довольно много времени, я понял, что обычно люди напрямую называют его как LB без особой подготовки. Итак, мой …

16 machine-learning accuracy