Вопросы с тегом «classification»

Статистическая классификация - это проблема идентификации подгруппы, к которой относятся новые наблюдения, где идентичность подгруппы неизвестна, на основе обучающего набора данных, содержащих наблюдения, подгруппа которых известна. Поэтому эти классификации будут показывать переменное поведение, которое может быть изучено статистикой.

1
Наименование средней абсолютной ошибки, аналогичной шкале Бриера?
Вчерашний вопрос « Определить точность модели, которая оценивает вероятность события» , заинтересовал меня оценкой вероятности. Оценка Бриера - это мера среднего квадрата ошибки. Показывает ли аналогичная средняя абсолютная погрешность показатели эффективности есть имя тоже?11NΣя = 1N( Р г е дя с т я о пя- р е фe r e …


1
Какой алгоритм классификации следует использовать, увидев, что t-SNE хорошо разделяет классы?
Давайте предположим, что у нас есть проблема с классификацией, и сначала мы хотим получить представление о данных, и мы делаем t-SNE. Результат t-SNE очень хорошо разделяет классы. Это подразумевает, что можно построить классификационную модель, которая также будет очень хорошо разделять классы (если t-SNE не разделяет хорошо, это не подразумевает много). …

2
оптимизация auc против logloss в задачах двоичной классификации
Я выполняю задачу бинарной классификации, где вероятность исхода довольно низкая (около 3%). Я пытаюсь решить, следует ли оптимизировать AUC или потерю журнала. Насколько я понял, AUC максимизирует способность модели различать классы, в то время как потери в журнале штрафуют расхождение между фактической и оценочной вероятностями. В моей задаче крайне важно …

1
Как уменьшить количество ложных срабатываний?
Я пытаюсь решить задачу, которая называется « Обнаружение пешеходов», и я тренирую двоичный класс по двум категориям: позитивные - люди, негативные - фон. У меня есть набор данных: количество позитивов = 3752 число отрицательных = 3800 Я использую train \ test split 80 \ 20% и форму scikit-learn RandomForestClassifier с …

1
Стратифицированная классификация со случайными лесами (или другой классификатор)
Итак, у меня есть матрица размером около 60 x 1000. Я рассматриваю ее как 60 объектов с 1000 объектов; 60 объектов сгруппированы в 3 класса (a, b, c). 20 предметов в каждом классе, и мы знаем истинную классификацию. Я хотел бы провести обучение под наблюдением на этом наборе из 60 …

3
Обнаружение выброса в очень маленьких наборах
Мне нужно получить как можно более точное значение яркости в основном стабильного источника света, учитывая двенадцать значений яркости образца. Датчик неидеален, и свет может иногда «мерцать» ярче или темнее, что можно игнорировать, отсюда моя потребность в обнаружении выбросов (я думаю?). Я немного ознакомился с различными подходами здесь и не могу …


3
Почему важен размер ВК?
Википедия говорит, что: Измерение VC - это мощность наибольшего множества точек, которые алгоритм может разрушить. Например, линейный классификатор имеет мощность n + 1. Мой вопрос, почему мы заботимся? Большинство наборов данных, по которым вы выполняете линейную классификацию, имеют тенденцию быть очень большими и содержать много точек.

3
Как построить путаницу для мультиклассового классификатора?
У меня проблема с 6 классами. Поэтому я строю мультиклассовый классификатор следующим образом: для каждого класса у меня есть один классификатор логистической регрессии, использующий один против всех, что означает, что у меня есть 6 различных классификаторов. Я могу сообщить матрицу путаницы для каждого из моих классификаторов. Но я хотел бы …

5
Почему мы отвергаем нулевую гипотезу на уровне 0,05, а не на уровне 0,5 (как мы делаем в классификации)
Проверка гипотез сродни проблеме классификации. Так, скажем, у нас есть 2 возможных ярлыка для наблюдения (субъекта) - Виновен против Не виновен. Пусть Non-Guilty будет нулевой гипотезой. Если бы мы рассматривали проблему с точки зрения классификации, мы бы обучали классификатор, который предсказывал бы вероятность принадлежности субъекта к каждому из 2 классов …

2
Инкрементальное обучение для моделей классификации в R
Предположим, у меня есть классификатор (это может быть любой из стандартных классификаторов, таких как дерево решений, случайный лес, логистическая регрессия и т. Д.) Для обнаружения мошенничества с использованием приведенного ниже кода library(randomForest) rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier Say, Y …

2
Почему Байесовский классификатор идеальный классификатор?
Считается идеальным случаем, когда структура вероятности, лежащая в основе категорий, известна полностью. Почему с помощью байесовского классификатора мы достигаем наилучшей производительности, которая может быть достигнута? Что является формальным доказательством / объяснением этого? Как мы всегда используем байесовский классификатор в качестве эталона для сравнения производительности всех других классификаторов.

3
Какую функцию потерь следует использовать для получения двоичного классификатора с высокой точностью или высокой степенью отзыва?
Я пытаюсь сделать детектор объектов, которые встречаются очень редко (в изображениях), планируя использовать двоичный классификатор CNN, применяемый в скользящем окне с измененным размером. Я построил сбалансированные положительно-отрицательные обучающие и тестовые наборы (кстати, правильно ли это делать в таком случае?), И классификатор отлично справляется с тестовым набором с точки зрения точности. …

2
Классификация с частично «неизвестными» данными
Предположим, я хочу узнать классификатор, который принимает вектор чисел в качестве входных данных и дает метку класса в качестве выходных данных. Мои тренировочные данные состоят из большого количества пар ввода-вывода. Тем не менее, когда я прихожу к тестированию на некоторых новых данных, эти данные, как правило, только частично завершены. Например, …

Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.