Вопросы с тегом «python»

Используйте для данных науки вопросы, связанные с языком программирования Python. Не предназначен для общих вопросов кодирования (-> stackoverflow).

1
Как предсказать будущие значения временного горизонта с помощью Keras?
Я только что построил эту нейронную сеть LSTM с Keras import numpy as np import pandas as pd from sklearn import preprocessing from keras.layers.core import Dense, Dropout, Activation from keras.activations import linear from keras.layers.recurrent import LSTM from keras.models import Sequential from matplotlib import pyplot #read and prepare data from datafile …

3
Нейронные сети - Найти наиболее похожие изображения
Я работаю с Python, scikit-learn и keras. У меня есть 3000 тысяч изображений лицевых часов, таких как следующие: Watch_1 , Watch_2 , Watch_3 . Я хочу написать программу, которая получит в качестве входных данных фотографию настоящих часов, которые могут быть сделаны в менее идеальных условиях, чем фотографии выше (другой цвет …

1
Поезд на партиях в Tensorflow
В настоящее время я пытаюсь обучить модель для большого файла CSV (> 70 ГБ с более чем 60 миллионов строк). Для этого я использую tf.contrib.learn.read_batch_examples. Я изо всех сил пытаюсь понять, как эта функция на самом деле читает данные. Если я использую размер пакета, например, 50 000, считывает ли он …

1
Нейронная сеть Tensorflow TypeError: Аргумент Fetch имеет недопустимый тип
Я делаю простую нейронную сеть, используя тензор потока, с данными, которые я собрал сам, однако, это не сотрудничает: PI столкнулся с ошибкой, которую я не могу исправить или исправить, и я буду рад вашей помощи. Сообщение об ошибке: TypeError: Аргумент Fetch 2861.6152 из 2861.6152 имеет недопустимый тип, должен быть строкой …

4
Извлечь информацию из предложения
Я создаю простой чат-бот. Я хочу получить информацию из ответа пользователя. Пример сценария: Bot : Hi, what is your name? User: My name is Edwin. Я хочу извлечь имя Эдвин из предложения. Тем не менее, пользователь может ответить по-разному, например, User: Edwin is my name. User: I am Edwin. User: …
11 python  nlp 


3
Проблема с IPython / Jupyter на Spark (Нераспознанный псевдоним)
Я работаю над настройкой набора виртуальных машин для экспериментов со Spark, прежде чем потратить деньги и потратить деньги на создание кластера с некоторым оборудованием. Краткое примечание: я академик с опытом работы в области прикладного машинного обучения и немного бросил работу в науке о данных. Я использую инструменты для вычислений, редко …

2
Как преобразовать категориальные данные в числовые данные в Pyspark
Я использую ноутбук Ipython для работы с приложениями pyspark. У меня есть файл CSV с множеством категориальных столбцов, чтобы определить, находится ли доход ниже или выше диапазона 50 КБ. Я хотел бы выполнить алгоритм классификации, используя все входные данные для определения диапазона доходов. Мне нужно создать словарь переменных для сопоставленных …

3
Какую регрессию использовать для расчета результата выборов в многопартийной системе?
Я хочу сделать прогноз на результат парламентских выборов. Мой результат будет%, который получает каждая сторона. Существует более двух сторон, поэтому логистическая регрессия не является жизнеспособным вариантом. Я мог бы сделать отдельный регресс для каждой партии, но в этом случае результаты были бы в некотором роде независимыми друг от друга. Это …

1
Реализация Python t-SNE: расхождение Кульбака-Лейблера
t-SNE, как и в [1], работает путем постепенного уменьшения расхождения Кульбака-Лейблера (KL), пока не будет выполнено определенное условие. Создатели t-SNE предлагают использовать дивергенцию KL в качестве критерия производительности для визуализаций: Вы можете сравнить расхождения Kullback-Leibler, о которых сообщает t-SNE. Совершенно нормально выполнить t-SNE десять раз и выбрать решение с самой …

1
Параметр scikit-learn n_jobs об использовании процессора и памяти
В большинстве оценок в scikit-learn в n_jobsпараметре fit/ predictmethod есть параметр для создания параллельных заданий с использованием joblib. Я заметил, что его установка -1создает всего 1 процесс Python и максимально увеличивает количество ядер, в результате чего загрузка ЦП достигает 2500% сверху. Это сильно отличается от установки некоторого положительного целого числа> …

2
Как я могу соответствовать категориальным типам данных для классификации случайных лесов?
Мне нужно найти точность набора обучающих данных, применяя алгоритм случайного леса. Но мой тип набора данных - как категориальный, так и числовой. Когда я пытался уместить эти данные, я получаю сообщение об ошибке. 'Вход содержит NaN, бесконечность или значение, слишком большое для dtype (' float32 ')'. Может быть проблема в …

3
Лучшие языки для научных вычислений [закрыто]
Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое количество доступных библиотек научных вычислений. …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

1
Keras LSTM с 1D временными рядами
Я изучаю, как использовать Keras, и я добился разумного успеха с моим помеченным набором данных, используя примеры в Chollet Deep Learning for Python . Набор данных ~ 1000 временных рядов с длиной 3125 с 3 потенциальными классами. Я хотел бы выйти за рамки базовых плотных слоев, которые дают мне около …

2
Почему обучение занимает так много времени на моем GPU?
Подробности: GPU : GTX 1080 Обучение : ~ 1,1 млн. Изображений, принадлежащих 10 классам Проверка : ~ 150 тысяч изображений, относящихся к 10 классам Время за эпоху : ~ 10 часов Я установил CUDA, cuDNN и Tensorflow (также Tensorflow GPU). Я не думаю, что моя модель настолько сложна, что занимает …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.