Что касается классификации на основе пикселей, вы на месте. Каждый пиксель является n-мерным вектором и будет назначен некоторому классу в соответствии с некоторой метрикой, будь то использование машин опорных векторов, MLE, некоторый классификатор knn и т. Д.
Что касается региональных классификаторов, тем не менее, за последние несколько лет произошли огромные изменения, обусловленные сочетанием графических процессоров, огромных объемов данных, облака и широкой доступности алгоритмов благодаря росту с открытым исходным кодом (облегчается). по github). Одно из самых больших событий в компьютерном видении / классификации было в сверточных нейронных сетях (CNNs), Сверточные слои "изучают" объекты, которые могут быть основаны на цвете, как с традиционными пиксельными классификаторами, но также создают детекторы границ и все виды других экстракторов признаков, которые могут существовать в области пикселей (отсюда и сверточная часть), которую вы никогда не сможет извлечь из классификации на основе пикселей. Это означает, что они с меньшей вероятностью ошибочно классифицируют пиксель в середине области пикселей другого типа - если вы когда-либо проводили классификацию и получали лед в середине Амазонки, вы поймете эту проблему.
Затем вы применяете полностью подключенную нейронную сеть к «особенностям», извлеченным из сверток, чтобы фактически выполнить классификацию. Одним из других больших преимуществ CNN является то, что они не зависят от масштаба и поворота, так как между слоями свертки и уровнем классификации обычно имеются промежуточные слои, которые обобщают элементы, используя объединение и выпадение, чтобы избежать переобучения и помочь в решении проблем, связанных с этим. масштаб и ориентация.
Существует множество ресурсов по сверточным нейронным сетям, хотя лучшим должен быть класс Standord от Андрея Карпати , который является одним из пионеров в этой области, и вся серия лекций доступна на youtube .
Конечно, существуют другие способы борьбы с классификацией на основе пикселей и областей, но в настоящее время это современный подход, имеющий множество применений помимо классификации по дистанционному зондированию, например, машинный перевод и автомобили с автоматическим управлением.
Вот еще один пример региональной классификации с использованием Open Street Map для тегированных обучающих данных, включая инструкции по настройке TensorFlow и работе на AWS.
Вот пример использования Google Earth Engine классификатора, основанного на обнаружении краев, в данном случае для кругового орошения - с использованием не более чем гауссовского ядра и сверток, но опять-таки, демонстрирующих силу подходов, основанных на области / крае.
В то время как превосходство объекта над пиксельной классификацией достаточно широко признано, здесь есть интересная статья в Письмах Дистанционного зондирования, оценивающая эффективность объектной классификации .
Наконец, забавный пример, просто чтобы показать, что даже с региональными / сверточными классификаторами, компьютерное зрение все еще действительно трудно - к счастью, самые умные люди в Google, Facebook и т. Д. Работают над алгоритмами, чтобы иметь возможность определить разницу между собаки, кошки и разные породы собак и кошек. Так что те, кто интересуется дистанционным зондированием, могут спать спокойно ночью: D