Вопросы с тегом «classification»

Статистическая классификация - это проблема идентификации подгруппы, к которой относятся новые наблюдения, где идентичность подгруппы неизвестна, на основе обучающего набора данных, содержащих наблюдения, подгруппа которых известна. Поэтому эти классификации будут показывать переменное поведение, которое может быть изучено статистикой.

2
Среднее (баллы) против балла (конкатенации) в перекрестной проверке
TLDR: Мой набор данных довольно маленький (120) выборок. При выполнении 10-кратной перекрестной проверки я должен: Соберите выходные данные из каждого тестового сгиба, объедините их в вектор, а затем вычислите ошибку на этом полном векторе прогнозов (120 выборок)? Или я должен вместо этого вычислить ошибку на выходах, которые я получаю в …

2
Объединение классификаторов путем подбрасывания монеты
Я изучаю курс машинного обучения, и слайды лекций содержат информацию, которая, на мой взгляд, противоречит рекомендуемой книге. Проблема в следующем: существует три классификатора: классификатор А, обеспечивающий лучшую производительность в нижнем диапазоне порогов, классификатор B, обеспечивающий лучшую производительность в более высоком диапазоне порогов, Классификатор C, что мы получаем, подбрасывая p-монету и …

4
Классификация с высокими показателями жира
Мне нужно обучить линейный классификатор на моем ноутбуке с сотнями тысяч точек данных и около десяти тысяч функций. Какие у меня варианты? Каково современное состояние для такого рода проблем? Кажется, что стохастический градиентный спуск является перспективным направлением, и я чувствую, что это состояние дел: «Pegasos: первичный оцененный субградиентный раствор для …

2
Увеличение числа функций приводит к снижению точности, но увеличению предварительного / повторного вызова
Я новичок в машинном обучении. В настоящее время я использую классификатор Наивного Байеса (NB), чтобы классифицировать небольшие тексты в 3 классах как положительные, отрицательные или нейтральные, используя NLTK и python. Проведя несколько тестов с набором данных, состоящим из 300 000 экземпляров (16 924 положительных, 7 477 отрицательных и 275 599 …

5
Что такое хороший ресурс, который включает в себя сравнение плюсов и минусов различных классификаторов?
Какой самый лучший из двух классификаторов из коробки? Да, я думаю, это вопрос на миллион долларов, и да, я знаю теорему об отсутствии бесплатного обеда , и я также прочитал предыдущие вопросы: Каков наилучший двухклассный классификатор для вашего приложения? и худший классификатор Тем не менее, мне интересно читать больше на …

4
Статистическое сходство временных рядов
Предположим, у кого-то есть временной ряд, из которого можно выполнить различные измерения, такие как период, максимум, минимум, среднее и т. Д., А затем использовать их для создания модельной синусоидальной волны с такими же атрибутами. Существуют ли какие-либо статистические подходы, которые можно использовать для количественной оценки? насколько точно фактические данные соответствуют …

10
Каков наилучший двухклассный классификатор для вашего приложения? [закрыто]
Закрыто . Этот вопрос основан на мнении . В настоящее время он не принимает ответы. Хотите улучшить этот вопрос? Обновите вопрос, чтобы ответить на него фактами и цитатами, отредактировав этот пост . Закрыто 3 года назад . Правила: один классификатор за ответ голосовать, если вы согласны уменьшить / удалить дубликаты. …

2
Нейронные сети против всего остального
Я не нашел удовлетворительного ответа на этот вопрос от Google . Конечно, если у меня есть данные порядка нескольких миллионов, то глубокое обучение - это путь. И я прочитал, что, когда у меня нет больших данных, тогда, возможно, лучше использовать другие методы в машинном обучении. Приведенная причина является чрезмерной. Машинное …

3
Интуиция для опорных векторных машин и гиперплоскости
В моем проекте я хочу создать модель логистической регрессии для прогнозирования двоичной классификации (1 или 0). У меня есть 15 переменных, 2 из которых являются категориальными, а остальные представляют собой смесь непрерывных и дискретных переменных. Чтобы соответствовать модели логистической регрессии, мне посоветовали проверить линейную отделимость с использованием SVM, персептрона или …

3
Для линейных классификаторов, большие коэффициенты подразумевают более важные особенности?
Я инженер-программист, работающий над машинным обучением. Насколько я понимаю, линейная регрессия (например, OLS) и линейная классификация (например, логистическая регрессия и SVM) делают прогноз на основе внутреннего произведения между обучаемыми коэффициентами и характеристическими переменными :вес⃗ вес→\vec{w}Икс⃗ Икс→\vec{x} Y^= ф( ш⃗ ⋅ х⃗ ) = f( ∑явесяИкся)Y^знак равное(вес→⋅Икс→)знак равное(ΣявесяИкся) \hat{y} = f(\vec{w} …

2
Какую меру ошибки обучения сообщать для случайных лесов?
В настоящее время я подгоняю случайные леса для задачи классификации, используя randomForestпакет в R, и не уверен, как сообщить об ошибке обучения для этих моделей. Моя ошибка обучения близка к 0%, когда я вычисляю ее, используя прогнозы, которые я получаю с помощью команды: predict(model, data=X_train) где X_trainданные обучения. В ответ …

3
Как выбрать метрику ошибки при оценке классификатора?
Я видел разные метрики ошибок, используемые в соревнованиях Kaggle: RMS, среднее значение, AUC и другие. Каково общее правило выбора метрики ошибки, т. Е. Как узнать, какую метрику ошибки использовать для данной проблемы? Есть ли рекомендации?

5
Какой алгоритм статистической классификации может предсказать истину / ложь для последовательности входных данных?
Учитывая последовательность входов, мне нужно определить, обладает ли эта последовательность определенным желаемым свойством. Свойство может быть только истинным или ложным, то есть существует только два возможных класса, к которым может принадлежать последовательность. Точная связь между последовательностью и свойством неясна, но я считаю, что она очень последовательна и должна подойти для …

2
Что такое «базовый уровень» в кривой точного отзыва
Я пытаюсь понять точную кривую отзыва, я понимаю, что такое точность и отзыв, но не понимаю, что такое базовое значение. Я читал эту ссылку https://classeval.wordpress.com/introduction/introduction-to-the-precision-recall-plot/ и я не понимаю часть базовой линии, как показано в «Кривая точного восстановления идеального классификатора», что она делает? и как мы это вычисляем? Это просто …

1
Глубина дерева решений
Поскольку алгоритм дерева решений разделяется на атрибут на каждом шаге, максимальная глубина дерева решений равна количеству атрибутов данных. Это верно?

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.