Позвольте мне начать с обратного порядка, который извлекает элемент и почему существует необходимость выбора элемента и уменьшения размерности.
Начиная с использования извлечения признаков, которое в основном предназначено для целей классификации. Классификация - это процесс принятия решения о том, к какой категории относится тот или иной объект. Он имеет два этапа: i) этап обучения, когда данные или объекты изучаются с использованием некоторого процесса (извлечение признаков); ii) этап тестирования, где неизвестный объект классифицируется с использованием признаков, изученных на предыдущем этапе (обучение).
Извлечение признаков, как следует из названия, учитывая, что цель данных - найти базовый шаблон. Этот базовый шаблон, который является термином как признак, соответствующий этим соответствующим данным. Существуют различные методологии, существующие для извлечения признаков, такие как машина опорных векторов (SVM).
Теперь извлечение объектов должно генерировать функции, которые должны быть
- крепкий
- отчетливый
- оптимальный набор функций
Выбор функции: определенный набор данных может быть представлен как одной функцией, так и набором функций. В процессе классификации система обучается как минимум для двух классов. Таким образом, система обучения будет генерировать одну функцию или набор функций. Эти особенности должны обладать свойствами, указанными выше.
Проблема возникает, когда есть набор функций для каждого класса и существует корреляция между некоторыми функциями. Это подразумевает, что среди этих коррелирующих признаков для представления достаточно одного или нескольких, и именно здесь выбор изображения входит в картину. Кроме того, эти функции должны быть сохранены с увеличением требований к памяти набора функций, также увеличивается.
Затем следует уменьшение размерности, которое является не чем иным, как частью процесса выбора признаков. Это процесс выбора оптимального набора функций, которые лучше всего описывают данные. Для этого существует множество методов, таких как анализ главных компонентов, анализ независимых компонентов, факторизация матрицы и т. Д.