Итак, я читал статью о SURF (Bay, Ess, Tuytelaars, Van Gool: Ускоренные надежные функции (SURF) ), и я не могу понять этот параграф ниже:
Из-за использования блочных фильтров и интегральных изображений нам не нужно итеративно применять один и тот же фильтр к выходным данным ранее отфильтрованного слоя, но вместо этого мы можем применять блочные фильтры любого размера с точно такой же скоростью непосредственно к исходному изображению и даже параллельно (хотя последний здесь не эксплуатируется). Поэтому масштабное пространство анализируется путем увеличения размера фильтра, а не итеративно уменьшая размер изображения, рисунок 4.
This is figure 4 in question.
PS: у бумаги есть объяснение целостного изображения, однако все содержание статьи основано на конкретном параграфе выше. Если кто-нибудь читал эту статью, не могли бы вы кратко упомянуть, что здесь происходит. Математическое объяснение довольно сложно, чтобы сначала хорошо понять, поэтому мне нужна помощь. Спасибо.
Редактировать, пару вопросов:
1.
Каждая октава подразделяется на постоянное количество уровней шкалы. Из-за дискретного характера интегральных изображений минимальная разность шкал между двумя последующими шкалами зависит от длины lo положительных или отрицательных лепестков частной производной второго порядка в направлении деривации (x или y), которая установлена на треть длины фильтра. Для фильтра 9x9 эта длина равна 3. Для двух последовательных уровней мы должны увеличить этот размер минимум на 2 пикселя (по одному пикселю с каждой стороны), чтобы размер оставался неравномерным и, таким образом, обеспечивалось наличие центрального пикселя. , Это приводит к общему увеличению размера маски на 6 пикселей (см. Рисунок 5).
Figure 5
Я не мог понять смысл строк в данном контексте.
Для двух последовательных уровней мы должны увеличить этот размер минимум на 2 пикселя (по одному пикселю с каждой стороны), чтобы размер оставался неравномерным и, таким образом, обеспечивалось наличие центрального пикселя.
Я знаю, что они пытаются что-то сделать с длиной изображения, если даже они пытаются сделать его нечетным, так что есть центральный пиксель, который позволит им вычислить максимум или минимум градиента пикселей. Я немного сомневаюсь в его контекстуальном значении.
2.
Для вычисления дескриптора используется вейвлет Хаара.
3.
Зачем нужен приблизительный фильтр?
4. У меня нет проблем с тем, как они узнали размер фильтра. Они «сделали» что-то эмпирически. Тем не менее, у меня есть некоторая ноющая проблема с этим куском линии
Выход фильтра 9x9, представленный в предыдущем разделе, рассматривается как начальный масштабный слой, к которому мы будем обращаться как масштаб s = 1.2 (аппроксимирующий производные Гаусса с σ = 1.2).
Как они узнали о значении σ. Более того, как вычисление масштабирования сделано, показано на изображении ниже. Причина, по которой я заявляю об этом изображении, состоит в том, что значение s=1.2
постоянно повторяется, без четкого указания о его происхождении.
5.
Гессенская матрица, представленная в терминах, L
представляет собой свертку градиента второго порядка гауссова фильтра и изображения.
Однако говорят, что «приближенный» определитель содержит только члены, включающие фильтр Гаусса второго порядка.
Значение w
составляет:
Мой вопрос, почему определитель вычисляется так же, как и выше, и какова связь между приближенной гессианской и гессианской матрицей.