Вопросы с тегом «python»

Используйте для данных науки вопросы, связанные с языком программирования Python. Не предназначен для общих вопросов кодирования (-> stackoverflow).

2
Попытка использовать TensorFlow для прогнозирования данных финансовых временных рядов
Я новичок в ML и TensorFlow (я начал около нескольких часов назад), и я пытаюсь использовать его для прогнозирования следующих нескольких точек данных во временном ряду. Я беру свой вклад и делаю это с этим: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | …

3
Сеть искусственных нейронов (ANN) с произвольным числом входов и выходов
Я хотел бы использовать ANNs для моей проблемы, но проблема заключается в том, что номера входов и выходов не являются фиксированными. Я сделал поиск в Google, прежде чем задавать вопрос, и обнаружил, что RNN может помочь мне с моей проблемой. Но все примеры, которые я нашел, так или иначе определили …

4
Визуализация предметов, часто покупаемых вместе
У меня есть набор данных в следующей структуре, вставленной в файл CSV: Banana Water Rice Rice Water Bread Banana Juice Каждая строка указывает коллекцию предметов, которые были куплены вместе. Например, первая строка обозначает, что элементыBanana , Waterи Riceбыли приобретены вместе. Я хочу создать визуализацию следующим образом: Это в основном сеточная …

1
Изменение формы данных для глубокого обучения с использованием Keras
Я новичок в Keras, и я начал с примера MNIST, чтобы понять, как на самом деле работает библиотека. Фрагмент кода проблемы MNIST в папке примера Keras имеет вид: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, Activation, …

2
Машинное обучение Python / Структура проекта Data Science
Я ищу информацию о том, как организовать проект машинного обучения Python. Для обычных проектов Python есть Cookiecutter, а для R ProjectTemplate . Это моя текущая структура папок, но я смешиваю ноутбуки Jupyter с реальным кодом Python, и это не очень понятно. . ├── cache ├── data ├── my_module ├── logs …
10 python 


4
Как почистить IMDB веб-страницу?
Я пытаюсь самостоятельно изучить работу с использованием Python как часть усилий по изучению анализа данных. Я пытаюсь очистить веб-страницу imdb, URL которой следующий: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012 Я использую модуль BeautifulSoup. Ниже приведен код, который я использую: r = requests.get(url) # where url is the above url bs = BeautifulSoup(r.text) for movie in …

2
Как выполнить логистическую регрессию с большим количеством функций?
У меня есть набор данных с 330 выборками и 27 функциями для каждой выборки, с проблемой двоичного класса для логистической регрессии. Согласно «правилу если десять» мне нужно по крайней мере 10 событий для каждой функции, которая будет включена. Тем не менее, у меня есть несбалансированный набор данных, с 20% положительного …

3
Найдите последовательные нули в DataFrame и выполните условную замену
У меня есть такой набор данных: Примерный фрейм данных import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Я хотел бы заменить некоторые из …

1
Избегайте перезагрузки DataFrame между разными ядрами Python
Есть ли способ сохранить переменную (большой стол / фрейм данных) в памяти и разделить ее между несколькими ноутбуками ipython? Я бы искал что-то, что концептуально похоже на постоянные переменные MATLAB. Там можно вызывать пользовательскую функцию / библиотеку из нескольких отдельных редакторов (записных книжек), и эта внешняя функция кэширует некоторый результат …

3
Как сгруппировать одинаковые значения и посчитать их частоту в Python?
Новичок в аналитике с Python, поэтому, пожалуйста, будьте осторожны :-) Я не смог найти ответ на этот вопрос - извинения, если на него уже ответили в другом формате в другом формате. У меня есть набор данных транзакций для торговой точки. Переменные вместе с объяснением: раздел: раздел магазина, ул; prod_name: название …

1
Неверный вывод линейной регрессии XGBoost
Я новичок в XGBoost, так что простите мое невежество. Вот код Python: import pandas as pd import xgboost as xgb df = pd.DataFrame({'x':[1,2,3], 'y':[10,20,30]}) X_train = df.drop('y',axis=1) Y_train = df['y'] T_train_xgb = xgb.DMatrix(X_train, Y_train) params = {"objective": "reg:linear"} gbm = xgb.train(dtrain=T_train_xgb,params=params) Y_pred = gbm.predict(xgb.DMatrix(pd.DataFrame({'x':[4,5]}))) print Y_pred Выход: [ 24.126194 24.126194] …

3
Построение модели машинного обучения для прогнозирования урожайности на основе экологических данных
У меня есть набор данных, содержащий данные о температуре, количестве осадков и урожайности сои для фермы за 10 лет (2005 - 2014). Я хотел бы прогнозировать урожайность на 2015 год на основе этих данных. Обратите внимание, что набор данных имеет ЕЖЕДНЕВНЫЕ значения для температуры и осадков, но только 1 значение …

2
Сколько времени занимают классификаторы scikit, чтобы классифицировать?
Я планирую использовать классификатор линейных опорных векторов (SVM) Scikit для классификации текста в корпусе, состоящем из 1 миллиона помеченных документов. Я планирую сделать следующее: когда пользователь вводит какое-либо ключевое слово, классификатор сначала классифицирует его по категории, а затем в документах этой категории будет выполняться последующий запрос на получение информации. У …

2
Стохастический градиентный спуск на основе векторных операций?
давайте предположим, что я хочу обучить алгоритм регрессии стохастического градиентного спуска, используя набор данных, который имеет N выборок. Поскольку размер набора данных фиксирован, я буду использовать данные T раз. На каждой итерации или «эпохе» я использую каждую обучающую выборку ровно один раз после случайного переупорядочения всего обучающего набора. Моя реализация …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.