Вопросы с тегом «scikit-learn»

scikit-learn - это библиотека машинного обучения для Python, которая предоставляет простые и эффективные инструменты для анализа данных и интеллектуального анализа данных с упором на машинное обучение. Он доступен всем и может использоваться повторно в различных контекстах. Он построен на NumPy и SciPy. Проект с открытым исходным кодом и коммерчески доступным (лицензия BSD).

8
Вектор-столбец y был передан, когда ожидался 1d-массив
Мне нужно соответствовать RandomForestRegressorот sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Этот код всегда работал, пока я не произвел предварительную обработку данных ( train_y). В сообщении об ошибке говорится: DataConversionWarning: вектор-столбец y был передан, когда ожидался массив 1d. Измените форму y на (n_samples,), например, используя ravel …

3
Python - что такое sklearn.pipeline.Pipeline?
Я не могу понять, как sklearn.pipeline.Pipelineименно работает. Есть несколько объяснений в доке . Например, что они означают: Конвейер преобразований с финальной оценкой. Чтобы прояснить мой вопрос, какие steps? Как они работают? редактировать Благодаря ответам я могу прояснить свой вопрос: Когда я вызываю конвейер и передаю в качестве шагов два трансформатора …

13
ImportError при импорте из sklearn: невозможно импортировать имя check_build
Я получаю следующую ошибку при попытке импорта из sklearn: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Я использую python 2.7, суперпак scipy-0.12.0b1, …


2
Как работает параметр class_weight в scikit-learn?
У меня много проблем с пониманием того, как работает class_weightпараметр в логистической регрессии scikit-learn. Ситуация Я хочу использовать логистическую регрессию для двоичной классификации очень несбалансированного набора данных. Классы помечены 0 (отрицательный) и 1 (положительный), а наблюдаемые данные находятся в соотношении примерно 19: 1, причем большинство образцов имеют отрицательный результат. Первая …

5
Запустите регрессию OLS с фреймом данных Pandas
У меня есть pandasфрейм данных, и я хотел бы предсказать значения столбца A по значениям в столбцах B и C. Вот игрушечный пример: import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40, 50], "C": [32, 234, 23, 23, 42523]}) В идеале у меня было бы что-то …


4
Как вычислить точность, отзыв, точность и f1-оценку для мультиклассового случая с помощью scikit learn?
Я работаю над проблемой анализа настроений, данные выглядят так: label instances 5 1190 4 838 3 239 1 204 2 127 Таким образом, мои данные несбалансированы, поскольку 1190 instancesпомечены значком 5. Для классификации я использую SVC scikit . Проблема в том, что я не знаю, как правильно сбалансировать мои данные, …


7
как проверить, какая версия nltk, scikit learn установлена?
В сценарии оболочки я проверяю, установлены ли эти пакеты или нет, если они не установлены, установите их. Итак, в сценарии оболочки: import nltk echo nltk.__version__ но он останавливает сценарий оболочки на importстроке в терминале linux попытался увидеть таким образом: which nltk который ничего не дает думать, что он установлен. Есть …

11
sklearn: обнаружены массивы с несогласованным количеством выборок при вызове LinearRegression.fit ()
Просто пытаюсь выполнить простую линейную регрессию, но эта ошибка меня сбивает с толку: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) который производит: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Эти выборки должны иметь одинаковые размеры, и они должны быть многочисленными массивами, так что мне не хватает?
103 scikit-learn 

3
RandomForestClassifier против ExtraTreesClassifier в scikit узнать
Может ли кто-нибудь объяснить разницу между RandomForestClassifier и ExtraTreesClassifier в scikit learn. Я потратил немало времени на чтение статьи: П. Гертс, Д. Эрнст. И Л. Вехенкель, «Чрезвычайно рандомизированные деревья», Машинное обучение, 63 (1), 3-42, 2006 г. Кажется, в этом разница для ET: 1) При выборе переменных в разбиении выборки берутся …

5
Параметр "stratify" из метода "train_test_split" (scikit Learn)
Я пытаюсь использовать train_test_splitпакет scikit Learn, но у меня проблемы с параметром stratify. Ниже приведен код: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) Однако у меня все еще возникает следующая проблема: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters passed: {'stratify': array([0, 0, …

4
Какие плюсы и минусы между get_dummies (Pandas) и OneHotEncoder (Scikit-learn)?
Я изучаю различные методы преобразования категориальных переменных в числовые для классификаторов машинного обучения. Я наткнулся на pd.get_dummiesметод и sklearn.preprocessing.OneHotEncoder()хотел посмотреть, чем они отличаются по производительности и использованию. Я нашел руководство по использованию OneHotEncoder()на https://xgdgsc.wordpress.com/2015/03/20/note-on-using-onehotencoder-in-scikit-learn-to-work-on-categorical-features/, поскольку sklearnдокументация была не слишком полезно на этой функции. У меня такое чувство, что я делаю …


Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.