Математика Харриса обнаружение угловых точек


23

Это математическое выражение для определения угла Харриса:

Это математическое выражение для определения угла Харриса ...

Но у меня есть следующие сомнения:

  1. Каково физическое значение и v ? Многие ссылки говорят, что это величина, на которую сместилось окно w . Так на сколько сдвинуто окно? Один пиксель или два пикселя?Uvвес
  2. Является ли суммирование по позициям пикселей в окне?
  3. Предполагая, что просто , I ( x , y ) является интенсивностью одиночного пикселя в точке ( x , y ) или суммой интенсивностей внутри окна с центром в точке ( x , y ) ?вес(Икс,Y)знак равно1я(Икс,Y)(Икс,Y)(Икс,Y)
  4. Согласно вики, они говорят, что изображение 2D, обозначено I, а затем просит рассмотреть участок изображения над областью , а затем использует обозначение I ( x , y ).(Икс,Y)я(Икс,Y)

Мне сложно понять математическое объяснение. У кого-нибудь есть идея?


2
Проверьте эту лекцию на детекторе угла Харриса. Это очень ясно: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

Я написал пост в своем личном блоге, который основан на лекции выше. matlabcorner.wordpress.com/2012/11/17/…
Андрей Рубштейн

Ответы:


31

Смысл этой формулы действительно очень прост. Представьте, что вы берете две одинаковые по размеру области изображения: синюю и красную:

введите описание изображения здесь

Функция окна равна 0 за пределами красного прямоугольника (для простоты мы можем предположить, что окно просто внутри константы внутри красного прямоугольника). Таким образом, оконная функция выбирает, на какие пиксели вы хотите смотреть, и присваивает относительный вес каждому пикселю. (Наиболее распространенным является окно Гаусса, поскольку оно вращательно-симметрично, эффективно для вычисления и выделения пикселей рядом с центром окна.) Синий прямоугольник смещен на (u, v).

Затем вы вычисляете сумму квадратов разности между частями изображения, помеченными красным и синим, т.е. вычитаете их попиксельно, возводите в квадрат разницу и суммируете результат (предполагая, для простоты, что окно = 1 в области, которую мы ищем) в). Это дает вам одно число для каждого возможного (u, v) -> E (u, v).

Посмотрим, что произойдет, если мы вычислим это для разных значений u / v:

Сначала держите v = 0:

введите описание изображения здесь

Это не должно вызывать удивления: разница между частями изображения наименьшая, когда смещение (u, v) между ними равно 0. По мере увеличения расстояния между двумя заплатами сумма квадратов разностей также увеличивается.

Сохраняя u = 0:

введите описание изображения здесь

График выглядит аналогично, но сумма квадратов различий между двумя частями изображения намного меньше, когда вы смещаете синий прямоугольник в направлении края.

Полный график E (u, v) выглядит так:

введите описание изображения здесь

Сюжет немного похож на «каньон»: разница будет небольшая, если вы сдвинете изображение в направлении каньона. Это потому, что этот патч изображения имеет доминирующую (вертикальную) ориентацию.

Мы можем сделать то же самое для другого патча изображения:

введите описание изображения здесь

Здесь график E (u, v) выглядит иначе:

введите описание изображения здесь

Независимо от того, каким образом вы меняете патч, он всегда выглядит иначе.

Таким образом, форма функции E (u, v) говорит нам кое-что о патче изображения

  • если E (u, v) почти везде 0, то в патче изображения, на который вы смотрите, нет текстуры
  • если E (u, v) имеет форму каньона, участок имеет доминирующую ориентацию (это может быть ребро или текстура)
  • если E (u, v) "конусовидная", патч имеет текстуру, но не имеет доминирующей ориентации. Вот такой патч ищет угловой детектор.

Многие источники говорят, что это величина, на которую смещено окно 'w' ... так на сколько смещено окно? Один пиксель ... два пикселя?

Обычно вы вообще не вычисляете E (u, v). Тебя интересует только его форма в окрестности (u, v) = (0,0). Таким образом, вы просто хотите разложить Тейлора в E (u, v) около (0,0), что полностью описывает его «форму».

Является ли суммирование по позициям пикселей в окне?

Говоря математически, более элегантно разрешить суммирование по всем пикселям. Практически говоря, нет смысла суммировать пиксели, где окно равно 0.


Thanx тонну Nikie ....
rotating_image

2
Я знал, что вы получите отличный ответ здесь, @rotating_image
karlphillip

спасибо karlphillip ..
вращающийся_изображение

1
Миллион голосов!
Фонон
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.