Вопросы с тегом «python»

Используйте для данных науки вопросы, связанные с языком программирования Python. Не предназначен для общих вопросов кодирования (-> stackoverflow).

2
Отладка нейронных сетей
Я построил искусственную нейронную сеть в Python, используя функцию оптимизации scipy.optimize.minimize (Conjugate Gradient). Я реализовал проверку градиента, дважды проверил все и т.д., и я уверен, что он работает правильно. Я запускал его несколько раз, и он достигает «Оптимизация успешно завершена», однако, когда я увеличиваю количество скрытых слоев, стоимость гипотезы увеличивается …

1
Почему моя модель Keras учится распознавать фон?
Я пытаюсь обучить эту реализацию Keras Deeplabv3 + на Pascal VOC2012, используя предварительно обученную модель (которая также обучалась на этом наборе данных). Я получил странные результаты с точностью, быстро сходящейся к 1,0: 5/5 [==============================] - 182s 36s/step - loss: 26864.4418 - acc: 0.7669 - val_loss: 19385.8555 - val_acc: 0.4818 Epoch …

1
Несбалансированные данные, приводящие к неправильной классификации в мультиклассовом наборе данных
Я работаю над классификацией текста, где у меня 39 категорий / классов и 8,5 миллионов записей. (В дальнейшем данные и категории будут увеличиваться). Структура или формат моих данных выглядит следующим образом. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 …

1
Может ли HDF5 надежно записываться и считываться одновременно отдельными процессами Python?
Я пишу сценарий для записи живых данных с течением времени в один файл HDF5, который включает весь мой набор данных для этого проекта. Я работаю с Python 3.6 и решил создать инструмент командной строки, используя clickдля сбора данных. Меня беспокоит, что произойдет, если сценарий сбора данных записывает данные в файл …
9 python  dataset 

2
Почему скорость обучения приводит к стремительному росту веса моей нейронной сети?
Я использую tenorflow для написания простых нейронных сетей для небольшого количества исследований, и у меня было много проблем с весами 'nan' во время обучения. Я пробовал много разных решений, таких как смена оптимизатора, изменение потерь, размера данных и т. Д., Но безрезультатно. Наконец, я заметил, что изменение в скорости обучения …

3
Экспорт весов (формула) из Случайного Лесного Регрессора в Scikit-Learn
Я обучил модель прогнозирования с помощью Scikit Learn на Python (Random Forest Regressor) и хочу каким-то образом извлечь вес каждой функции, чтобы создать превосходный инструмент для ручного прогнозирования. Единственное, что я нашел, - model.feature_importances_но это не помогает. Есть ли способ добиться этого? def performRandomForest(X_train, y_train, X_test, y_test): '''Perform Random Forest …

7
Библиотека Python, которая может вычислить матрицу путаницы для классификации по нескольким меткам
Я ищу библиотеку Python, которая может вычислить матрицу путаницы для классификации по нескольким меткам . FYI: scikit-learn не поддерживает мульти-метки для матрицы путаницы) В чем разница между Multiclass и Multilabel Problem

2
Многомерная линейная регрессия в Python
Я ищу пакет Python, который реализует многомерную линейную регрессию. (Терминологическое примечание: многомерная регрессия имеет дело со случаем, когда существует более одной зависимой переменной, в то время как множественная регрессия имеет дело со случаем, когда существует одна зависимая переменная, но более чем одна независимая переменная.)

1
Как двоично кодировать многозначную категориальную переменную из кадра данных Pandas?
Предположим, у нас есть следующий фрейм данных с несколькими значениями для определенного столбца: categories 0 - ["A", "B"] 1 - ["B", "C", "D"] 2 - ["B", "D"] Как мы можем получить такой стол? "A" "B" "C" "D" 0 - 1 1 0 0 1 - 0 1 1 1 2 …
9 python  pandas 

2
Реализовать дополнительный наивный байесовский в python?
проблема Я пытался использовать наивный байесовский код на помеченном наборе данных о преступности, но получил очень плохие результаты (точность 7%). Наивный Байес работает намного быстрее, чем другие алгоритмы, которые я использовал, поэтому я хотел попытаться выяснить, почему счет был таким низким. Исследование После прочтения я обнаружил, что наивный байесовский анализ …

2
Кластеризация документов с использованием тем, полученных из скрытого распределения Дирихле
Я хочу использовать скрытое выделение дирихле для проекта, и я использую Python с библиотекой gensim. После нахождения тем я хотел бы кластеризовать документы, используя алгоритм, такой как k-means (в идеале я хотел бы использовать хороший для перекрывающихся кластеров, поэтому любая рекомендация приветствуется). Мне удалось получить темы, но они в форме: …

2
Почему регрессия Gradient Boosting предсказывает отрицательные значения, когда в моем тренировочном наборе нет отрицательных значений y?
Как я могу увеличить количество деревьев в scikit узнать «S GradientBoostingRegressor, я получаю более негативные прогнозы, несмотря на то, нет отрицательных значений в моем обучении или тестирования набора. У меня есть около 10 функций, большинство из которых являются двоичными. Вот некоторые параметры, которые я настраивал: количество деревьев / итераций; глубина …

2
Ошибка памяти при использовании большего количества слоев в модели CNN
На моем dell core i7 - 16 ГБ ОЗУ - 4 ГБ 960-метровый ноутбук с графическим процессором я работаю над проектом по классификации изображений КТ легких с использованием 3D CNN. Я использую процессорную версию tenorflow. Изображения подготовлены как размер массива (25,50,50). В моей модели CNN было 2 слоя конвона, два …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.