Существуют ли какие-либо алгоритмы компьютерного зрения, специально предназначенные для глубинных изображений?


9

Я искал алгоритмы обнаружения маркеров для использования с приложением, основанным на kinect, и большая часть работы, которую я смог найти, очевидно, сосредоточена на обнаружении признаков в «нормальных» изображениях.

Однако аппаратное обеспечение kinect обеспечивает (по сути, после того, как вы настроили) 11-битное значение глубины на пиксель.

Это глубинное изображение также содержит различные визуальные артефакты от теней, отбрасываемых по краям объектов (см., Например, сильную черную рамку в этом видео http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Хотя некоторые традиционные методы машинного зрения (например, обнаружение контуров) хорошо работают с этим, другие - нет, и кажется, что в сети мало информации об этом.

В качестве простого примера, использование значения глубины делает тривиальным определение ориентации блока маркера после его нахождения.

Итак, кто-нибудь видел какие-либо обсуждения / документы / и т. Д., Которые охватывают обработку изображения глубины для обнаружения признаков?

Кто-нибудь может порекомендовать хороший алгоритм для определения маркеров «глубины» (эффективно блоков оригами вместо печатных ч / б маркеров)?

До сих пор я проводил эксперименты adhoc с использованием opencv для обработки изображений, но это далеко не так стабильно или достаточно быстро.

Если вы ссылаетесь на коммерческий продукт машинного зрения без каких-либо испытаний, укажите в своем ответе, почему вы считаете это целесообразным.


Для этого есть тонны бумаг и программ. Извините, не могу ответить более подробно, по низкой пропускной способности. Смотрите приложение RGBDemo, оно включает в себя распознаватель объектов. Кроме того, PointCloud Library (PCL), ROS, OpenCV для программного обеспечения и предположительно Google Scholar для бумаг. Вы упоминаете, что OpenCV вас не устраивает, но PCL и RGBDemo могут быть.

Я не ищу реализацию демонстрации, которая демонстрирует kinect, или некоторых демонстраций ПК, которые показывают, как генерировать 3d-модель из kinect или набора инструментов для обработки изображений (то есть opencv). Я ищу алгоритмы для распознавания объектов по глубине изображений.

RGBDemo реализует эти алгоритмы. Прочитайте код или ссылки для кода.

Ответы:


8

Моим любимым дескриптором функций 2.5D / 3D для регистрации и распознавания является вращающееся изображение (оригинал статьи + больше деталей в диссертации и программное обеспечение, доступное в CMU).

Другие последние достижения (все доступные для поиска в режиме онлайн для подходящих алгоритмов) включают в себя: 3D-просеивание, гистограмма объектов с быстрой точкой, радиально-ориентированные радиальные объекты (NARF), дескрипторы ядра глубины. Старые методы просто использовали свойства поверхности, такие как кривизна и края, чтобы идентифицировать участки области.

Какой лучше? Зависит от того, что вы хотите найти, неизменность точки обзора, дополнительный беспорядок и т. Д.


7

Вы правильно поняли все ключевые слова, я удивлен, что вы действительно не нашли связанных статей при поиске материала.

К счастью, у меня есть доступ к цифровой библиотеке IEEE Xplore. Раньше мне не требовался какой-либо из этих конкретных алгоритмов, но он выглядит очень интересным, поэтому вот некоторые результаты быстрого поиска, которые, на мой взгляд, могут быть актуальны (не судите их по названиям, посмотрите их рефераты):

К сожалению, я не думаю, что вы можете получить доступ к любому из этих документов бесплатно, по крайней мере, через библиотеку IEEE Xplore. Если у вас нет доступа, вы, вероятно, можете обойтись с ученым Google , и там есть несколько бесплатных бумажных баз данных (я использовал базу данных Mendeley еще тогда, когда у меня еще не было доступа к IEEE). Кроме того, просто поиск частей абстрактной или случайной части статьи в Google иногда дает некоторые результаты (вы можете наткнуться на почти готовые предварительно опубликованные версии статьи).

Поисковыми запросами, которые я использовал для поиска упомянутых работ, были: 3D-изображение , глубина изображения , Kinect . Вы также можете добавить обработку при поиске первых двух запросов.

Надеюсь, это поможет некоторым! Мне жаль, что я не могу больше вдаваться в тему, звучит действительно интересно.



@mankoff только из резюме, я просто вижу работу, концентрирующуюся на отслеживании, и кажется, что она концентрируется на использовании прямой информации без особого обнаружения функций. Но тогда я просто прочитал реферат, так что не уверен.

Гуглить названия статей достаточно, чтобы найти PDF-файлы для некоторых из этих статей. Еще один хороший источник - CiteSeer: citeseerx.ist.psu.edu/index Спасибо за список статей!
Повторно
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.