Вопросы с тегом «scikit-learn»

scikit-learn - это библиотека машинного обучения для Python, которая предоставляет простые и эффективные инструменты для анализа данных и интеллектуального анализа данных с упором на машинное обучение. Он доступен всем и может использоваться повторно в различных контекстах. Он построен на NumPy и SciPy. Проект с открытым исходным кодом и коммерчески доступным (лицензия BSD).

7
Стратифицированный поезд / тест-сплит в scikit-learn
Мне нужно разделить мои данные на обучающий набор (75%) и тестовый набор (25%). В настоящее время я делаю это с помощью кода ниже: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Однако я хотел бы стратифицировать свой набор тренировочных данных. Как я могу это сделать? Я изучал этот StratifiedKFoldметод, но не …

3
Преобразовать несколько категориальных столбцов
В моем наборе данных у меня есть два категориальных столбца, которые я хотел бы перечислить. Оба столбца содержат страны, некоторые перекрываются (отображаются в обоих столбцах). Я хотел бы дать одно и то же число в столбцах 1 и 2 для одной и той же страны. Мои данные выглядят примерно так: …

2
Использование GridSearchCV с IsolationForest для поиска выбросов
Я хочу использовать IsolationForestдля обнаружения выбросов. Я хочу найти лучшие параметры для модели с GridSearchCV. Проблема в том, что я всегда получаю одну и ту же ошибку: TypeError: If no scoring is specified, the estimator passed should have a 'score' method. The estimator IsolationForest(behaviour='old', bootstrap=False, contamination='legacy', max_features=1.0, max_samples='auto', n_estimators=100, n_jobs=None, …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.