ТЛ; др
- Каков рекомендуемый способ обработки
discrete
данных при обнаружении аномалий? - Каков рекомендуемый способ обработки
categorical
данных при обнаружении аномалий? - Этот ответ предлагает использовать дискретные данные для фильтрации результатов.
- Возможно, замените значение категории шансом наблюдения перктата?
вступление
Это моя первая публикация здесь, поэтому, пожалуйста, если что-то не кажется технически правильным, ни в форматировании, ни в использовании правильных определений, мне интересно знать, что нужно было использовать вместо этого.
Onwards.
Недавно я принимал участие в классе машинного обучения Эндрю Нг
Для обнаружения аномалий нас учили определять, каковы параметры нормального / гауссова распределения для данного признака / переменной, в наборе данных, а затем определять вероятность выбранного набора значений обучающего примера / наблюдения с учетом этого конкретного Гауссово распределение, а затем взятие произведения вероятностей признаков.
метод
Выберите особенности / переменные, которые, по нашему мнению, объясняют рассматриваемое действие: { x 1 , x 2 , … , x i }
Подберите параметры гауссианы для каждой функции: σ2=1
Для каждого обучающего примера вычислите: p ( x ) = n ∏ j = 1 p ( x j ; μ j , σ 2 j )
Затем мы помечаем как аномалию ( ), учитывая: y = { 1
Это дает нам метод, с помощью которого можно определить, требует ли пример дальнейшей проверки.
Мои вопросы)
Это кажется нормальным для непрерывных переменных / функций, но дискретные данные не рассматриваются.
Вопросы: (обновлено: 2015-11-24)
Есть ли другой метод, который учитывает то, о чем я здесь спрашиваю, чтобы я мог продолжить изучение / изучение?- Каков рекомендуемый способ обработки
discrete
данных при обнаружении аномалий? - Каков рекомендуемый способ обработки
categorical
данных при обнаружении аномалий?
Изменить: 2017-05-03
- Этот ответ предлагает использовать дискретные данные для фильтрации результатов.
- Возможно, замените значение категории шансом наблюдения перктата?