программирование scikit-learn

7

Стратифицированный поезд / тест-сплит в scikit-learn

Мне нужно разделить мои данные на обучающий набор (75%) и тестовый набор (25%). В настоящее время я делаю это с помощью кода ниже: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Однако я хотел бы стратифицировать свой набор тренировочных данных. Как я могу это сделать? Я изучал этот StratifiedKFoldметод, но не …

88 python scikit-learn

3

Преобразовать несколько категориальных столбцов

В моем наборе данных у меня есть два категориальных столбца, которые я хотел бы перечислить. Оба столбца содержат страны, некоторые перекрываются (отображаются в обоих столбцах). Я хотел бы дать одно и то же число в столбцах 1 и 2 для одной и той же страны. Мои данные выглядят примерно так: …

10 python python-3.x pandas scikit-learn categorical-data

2

Использование GridSearchCV с IsolationForest для поиска выбросов

Я хочу использовать IsolationForestдля обнаружения выбросов. Я хочу найти лучшие параметры для модели с GridSearchCV. Проблема в том, что я всегда получаю одну и ту же ошибку: TypeError: If no scoring is specified, the estimator passed should have a 'score' method. The estimator IsolationForest(behaviour='old', bootstrap=False, contamination='legacy', max_features=1.0, max_samples='auto', n_estimators=100, n_jobs=None, …

10 python scikit-learn

Вопросы с тегом «scikit-learn»