Вопросы с тегом «classification»

Экземпляр контролируемого обучения, который определяет категорию или категории, к которым принадлежит новый экземпляр набора данных.

3
Лучшие языки для научных вычислений [закрыто]
Закрыто . Этот вопрос должен быть более сфокусированным . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы он был сосредоточен только на одной проблеме, отредактировав этот пост . Закрыто 5 лет назад . Похоже, что большинство языков имеют некоторое количество доступных библиотек научных вычислений. …
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 

3
Как я могу сделать классификацию с категориальными данными, которые не являются фиксированными?
У меня есть проблема классификации с категориальными и числовыми данными. Проблема, с которой я сталкиваюсь, заключается в том, что мои категориальные данные не являются фиксированными, это означает, что у нового кандидата, метка которого я хочу предсказать, может быть новая категория, которая ранее не наблюдалась. Например, если мои категорические данные были …

3
Ранняя остановка на потерю проверки или на точность?
В настоящее время я обучаю нейронную сеть, и я не могу решить, какой из них использовать для реализации моих критериев ранней остановки: потеря проверки или метрики, такие как точность / f1score / auc / независимо от того, что вычислено на наборе проверки. В своем исследовании я натолкнулся на статьи, защищающие …

3
Когда мы должны считать набор данных несбалансированным?
Я сталкиваюсь с ситуацией, когда количество положительных и отрицательных примеров в наборе данных несбалансировано. Мой вопрос заключается в том, есть ли какие-то практические правила, которые говорят нам, когда нам следует отбирать большую категорию, чтобы навязать некоторый баланс в наборе данных. Примеры: Если число положительных примеров равно 1000, а число отрицательных …

1
Библиотеки для (алгоритмы распространения меток / частое извлечение подграфа) для графов в R
Общее описание проблемы У меня есть график, где некоторые вершины помечены с типом с 3 или 4 возможных значений. Для остальных вершин тип неизвестен. Моя цель - использовать график, чтобы предсказать тип для немаркированных вершин. Возможные рамки Я подозреваю, что это вписывается в общую структуру проблем распространения этикеток, основываясь на …

4
Почему несколько типов моделей могут давать почти одинаковые результаты?
Я анализировал набор данных из ~ 400 тыс. Записей и 9 переменных. Зависимая переменная является двоичной. Я установил логистическую регрессию, дерево регрессии, случайный лес и дерево с градиентным повышением. Все они дают виртуально идентичные данные соответствия, когда я проверяю их на другом наборе данных. Почему это так? Я предполагаю, что …

1
Как определить сложность английского предложения?
Я работаю над приложением, чтобы помочь людям выучить английский как второй язык. Я подтвердил, что предложения помогают в изучении языка, предоставляя дополнительный контекст. Я сделал это, проведя небольшое исследование в классе из 60 учеников. Я добыл более ста тысяч предложений из Википедии для различных английских слов (включая 800 слов Барронса …

3
Предсказать лучшее время звонка
У меня есть набор данных, включающий набор клиентов в разных городах Калифорнии, время вызова для каждого клиента и статус вызова (True, если клиент отвечает на вызов, и False, если клиент не отвечает). Я должен найти подходящее время звонка для будущих клиентов, так что вероятность ответа на звонок высока. Итак, какова …

2
Сколько времени занимают классификаторы scikit, чтобы классифицировать?
Я планирую использовать классификатор линейных опорных векторов (SVM) Scikit для классификации текста в корпусе, состоящем из 1 миллиона помеченных документов. Я планирую сделать следующее: когда пользователь вводит какое-либо ключевое слово, классификатор сначала классифицирует его по категории, а затем в документах этой категории будет выполняться последующий запрос на получение информации. У …

1
Несбалансированные данные, приводящие к неправильной классификации в мультиклассовом наборе данных
Я работаю над классификацией текста, где у меня 39 категорий / классов и 8,5 миллионов записей. (В дальнейшем данные и категории будут увеличиваться). Структура или формат моих данных выглядит следующим образом. ---------------------------------------------------------------------------------------- | product_title | Key_value_pairs | taxonomy_id | ---------------------------------------------------------------------------------------- Samsung S7 Edge | Color:black,Display Size:5.5 inch,Internal | 211 Storage:128 …

1
Как мне подойти к проблеме классификации, когда один из классов определяется как «ни один из других»?
Предположим, что меня интересуют три класса , c 2 , c 3 . Но мой набор данных на самом деле содержит еще несколько реальных классов ( c j ) n j = 4 .с1c1c_1с2c2c_2с3с3c_3( сJ)NJ = 4(сJ)Jзнак равно4N(c_j)_{j=4}^n Очевидный ответ , чтобы определить новый класс гр 4 , который относится …

4
Классифицировать многомерный временной ряд
У меня есть набор данных, состоящий из временных рядов (8 точек) примерно с 40 измерениями (поэтому каждый временной ряд равен 8 на 40). Соответствующий результат (возможные результаты для категорий) равен 0 или 1. Каков наилучший подход для разработки классификатора для временных рядов с несколькими измерениями? Моя первоначальная стратегия состояла в …

2
Классификация векторных последовательностей
Мой набор данных состоит из векторных последовательностей. Каждый вектор имеет 50 вещественных измерений. Количество векторов в последовательности колеблется от 3-5 до 10-15. Другими словами, длина последовательности не является фиксированной. Некоторое значительное количество последовательностей (не векторов!) Помечено меткой класса. Моя задача состоит в том, чтобы узнать классификатор, который дает последовательность векторов, …

2
Реализовать дополнительный наивный байесовский в python?
проблема Я пытался использовать наивный байесовский код на помеченном наборе данных о преступности, но получил очень плохие результаты (точность 7%). Наивный Байес работает намного быстрее, чем другие алгоритмы, которые я использовал, поэтому я хотел попытаться выяснить, почему счет был таким низким. Исследование После прочтения я обнаружил, что наивный байесовский анализ …

1
Реляционный Data Mining без ILP
У меня есть огромный набор данных из реляционной базы данных, для которого мне нужно создать модель классификации. Обычно для этой ситуации я бы использовал индуктивное логическое программирование (ILP), но из-за особых обстоятельств я не могу этого сделать. Другой способ решения этой проблемы - просто объединить значения, когда у меня есть …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.