Насколько целесообразно было бы классифицировать текстуру изображения, используя элементы дискретного косинусного преобразования? Погуглив «текстовую классификацию dct», можно найти только одну академическую статью по этой теме, используя нейронную сеть.
Для моего приложения у меня есть большой корпус помеченных изображений, в которых все изображение представляет собой непротиворечивую текстуру (например, снимки крупного плана одеяла, коры дерева, травянистого поля и т. Д.).
Вдохновленный ответом на предыдущий вопрос , я рассматривал следующий подход:
- разбить каждое изображение на NxN блоков пикселей
- взять DCT каждого блока
- объединить каждый DCT в массив 1xM и передать его в алгоритм кластеризации K-Means, а также получить метку кластера для каждого DCT
- рассчитать гистограмму кластеризации меток для каждого изображения путем подсчета каждой метки на изображение из # 3
- обучить классификатор SVM, передав ему набор [(гистограмма, метка изображения)]
Насколько хорошо это будет работать? Я реализовал аналогичную систему, используя функции, извлеченные с помощью алгоритмов SIFT / SURF, но я смог получить точность только около 60%.
Какими еще способами я мог бы использовать DCT для классификации текстур?