Наука о данных python

1

Как предсказать будущие значения временного горизонта с помощью Keras?

Я только что построил эту нейронную сеть LSTM с Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile …

11 machine-learning python keras prediction forecasting

3

Нейронные сети - Найти наиболее похожие изображения

Я работаю с Python, scikit-learn и keras. У меня есть 3000 тысяч изображений лицевых часов, таких как следующие: Watch_1 , Watch_2 , Watch_3 . Я хочу написать программу, которая получит в качестве входных данных фотографию настоящих часов, которые могут быть сделаны в менее идеальных условиях, чем фотографии выше (другой цвет …

11 python neural-network keras

1

Поезд на партиях в Tensorflow

В настоящее время я пытаюсь обучить модель для большого файла CSV (> 70 ГБ с более чем 60 миллионов строк). Для этого я использую tf.contrib.learn.read_batch_examples. Я изо всех сил пытаюсь понять, как эта функция на самом деле читает данные. Если я использую размер пакета, например, 50 000, считывает ли он …

11 python tensorflow

1

Нейронная сеть Tensorflow TypeError: Аргумент Fetch имеет недопустимый тип

Я делаю простую нейронную сеть, используя тензор потока, с данными, которые я собрал сам, однако, это не сотрудничает: PI столкнулся с ошибкой, которую я не могу исправить или исправить, и я буду рад вашей помощи. Сообщение об ошибке: TypeError: Аргумент Fetch 2861.6152 из 2861.6152 имеет недопустимый тип, должен быть строкой …

11 machine-learning python neural-network tensorflow

4

Извлечь информацию из предложения

Я создаю простой чат-бот. Я хочу получить информацию из ответа пользователя. Пример сценария: Bot : Hi, what is your name? User: My name is Edwin. Я хочу извлечь имя Эдвин из предложения. Тем не менее, пользователь может ответить по-разному, например, User: Edwin is my name. User: I am Edwin. User: …

11 python nlp

3

Как создать интерактивную диаграмму рассеяния PCA на Python?

Библиотека matplotlib очень способна, но ей не хватает интерактивности, особенно внутри Jupyter Notebook. Я хотел бы хороший автономные черчения инструмента , как plot.ly .

11 python visualization pca jupyter

3

Проблема с IPython / Jupyter на Spark (Нераспознанный псевдоним)

Я работаю над настройкой набора виртуальных машин для экспериментов со Spark, прежде чем потратить деньги и потратить деньги на создание кластера с некоторым оборудованием. Краткое примечание: я академик с опытом работы в области прикладного машинного обучения и немного бросил работу в науке о данных. Я использую инструменты для вычислений, редко …

11 python apache-spark pyspark ipython

2

Как преобразовать категориальные данные в числовые данные в Pyspark

Я использую ноутбук Ipython для работы с приложениями pyspark. У меня есть файл CSV с множеством категориальных столбцов, чтобы определить, находится ли доход ниже или выше диапазона 50 КБ. Я хотел бы выполнить алгоритм классификации, используя все входные данные для определения диапазона доходов. Мне нужно создать словарь переменных для сопоставленных …

11 python apache-spark categorical-data pyspark

3

Какую регрессию использовать для расчета результата выборов в многопартийной системе?

Я хочу сделать прогноз на результат парламентских выборов. Мой результат будет%, который получает каждая сторона. Существует более двух сторон, поэтому логистическая регрессия не является жизнеспособным вариантом. Я мог бы сделать отдельный регресс для каждой партии, но в этом случае результаты были бы в некотором роде независимыми друг от друга. Это …

11 classification r python regression predictive-modeling

1

Реализация Python t-SNE: расхождение Кульбака-Лейблера

t-SNE, как и в [1], работает путем постепенного уменьшения расхождения Кульбака-Лейблера (KL), пока не будет выполнено определенное условие. Создатели t-SNE предлагают использовать дивергенцию KL в качестве критерия производительности для визуализаций: Вы можете сравнить расхождения Kullback-Leibler, о которых сообщает t-SNE. Совершенно нормально выполнить t-SNE десять раз и выбрать решение с самой …

11 machine-learning python

1

Параметр scikit-learn n_jobs об использовании процессора и памяти

В большинстве оценок в scikit-learn в n_jobsпараметре fit/ predictmethod есть параметр для создания параллельных заданий с использованием joblib. Я заметил, что его установка -1создает всего 1 процесс Python и максимально увеличивает количество ядер, в результате чего загрузка ЦП достигает 2500% сверху. Это сильно отличается от установки некоторого положительного целого числа> …

11 python scikit-learn

2

Как я могу соответствовать категориальным типам данных для классификации случайных лесов?

Мне нужно найти точность набора обучающих данных, применяя алгоритм случайного леса. Но мой тип набора данных - как категориальный, так и числовой. Когда я пытался уместить эти данные, я получаю сообщение об ошибке. 'Вход содержит NaN, бесконечность или значение, слишком большое для dtype (' float32 ')'. Может быть проблема в …

11 python data-mining random-forest

3

Лучшие языки для научных вычислений [закрыто]

Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое количество доступных библиотек научных вычислений. …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

1

Keras LSTM с 1D временными рядами

Я изучаю, как использовать Keras, и я добился разумного успеха с моим помеченным набором данных, используя примеры в Chollet Deep Learning for Python . Набор данных ~ 1000 временных рядов с длиной 3125 с 3 потенциальными классами. Я хотел бы выйти за рамки базовых плотных слоев, которые дают мне около …

10 python deep-learning time-series lstm rnn

2

Почему обучение занимает так много времени на моем GPU?

Подробности: GPU : GTX 1080 Обучение : ~ 1,1 млн. Изображений, принадлежащих 10 классам Проверка : ~ 150 тысяч изображений, относящихся к 10 классам Время за эпоху : ~ 10 часов Я установил CUDA, cuDNN и Tensorflow (также Tensorflow GPU). Я не думаю, что моя модель настолько сложна, что занимает …

10 machine-learning python keras

Вопросы с тегом «python»