Как рассчитать количество функций на основе разрешения изображения?


18

Просто покрыта нелинейная Гипотеза Эндрю Нг из Neural Netowrks, и у нас был вопрос множественного выбора для определения количества функций для изображения разрешения 100x100 из grescale интенсивности.

И ответ был 50 миллионов, 5 х 107

Тем не менее, ранее для 50 х 50 пикселей, серого изображения. количество функций 50х50 (2500)

Почему бы это было 5 х 107 вместо 10,000 ?

Тем не менее, он говорит, что включает все квадратичные термины ( xixj ) в качестве признаков

Предположим, вы учитесь распознавать автомобили по 100 × 100 пиксельным изображениям (оттенки серого, а не RGB). Пусть объекты будут значениями интенсивности пикселей. Если вы обучите логистическую регрессию, включающую в себя все квадратичные термины ( xixj ), как функции, сколько у вас будет функций?

и на предыдущем слайде, касающемся 100x100, квадратичные элементы ( xi x xj ) = 3 миллиона элементов, но я все еще не могу указать на соединение.

Ответы:


16

Возможно, более простой случай прояснит ситуацию. Допустим, мы выбрали образец пикселей 1х2 вместо 100х100.

Образцы пикселей с изображения

+----+----+
| x1 | x2 |
+----+----+

Представьте, что при построении нашего обучающего набора мы заметили, что его нельзя легко разделить линейной моделью, поэтому мы решили добавить полиномиальные термины, чтобы лучше соответствовать данным.

Допустим, мы решили построить наши многочлены, включив все интенсивности пикселей и все возможные кратные, которые могут быть сформированы из них.

Поскольку наша матрица мала, давайте перечислим их:

x1, x2, x12, x22, x1×x2, x2×x1

Интерпретируя приведенную выше последовательность функций, можно увидеть, что существует закономерность. Первые два слагаемых, группа 1, являются признаками, состоящими только из интенсивности их пикселей. Следующие два термина после этого, группа 2, являются признаками, состоящими из квадрата их интенсивности. Последние два члена, группа 3, являются произведением всех комбинаций парных (двух) интенсивностей пикселей.

группа 1: x1, x2

группа 2: x12, x22

группа 3: x1×x2, x2×x1

Но подождите, есть проблема. Если вы посмотрите на члены группы 3 в последовательности ( и x 2 × x 1 ), вы заметите, что они равны. Помните наш пример жилья. Представьте, что для одного и того же дома есть две функции: х1 = квадратная метра и х2 = квадратная метра ... Это не имеет никакого смысла! Итак, нам нужно избавиться от дубликата, скажем, произвольно x 2 × x 1 . Теперь мы можем переписать список функций группы три как:x1×x2x2×x1x2×x1

группа 3: x1×x2

Мы считаем функции во всех трех группах и получаем 5.

Но это игрушечный пример. Получим общую формулу для расчета количества объектов. Давайте использовать наши оригинальные группы функций в качестве отправной точки.

sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×N

Ах! Но нам пришлось избавиться от дубликата товара в группе 3.

Поэтому для правильного подсчета функций для группы 3 нам потребуется способ подсчета всех уникальных парных продуктов в матрице. Что можно сделать с помощью биномиального коэффициента, который является методом подсчета всех возможных уникальных подгрупп размера k из равной или большей группы размера n. Поэтому для правильного подсчета объектов в группе 3 рассчитайте .C(m×n,2)

Таким образом, наша общая формула будет:

m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)

Давайте использовать его для вычисления количества функций в нашем примере с игрушкой:

2×1×2+C(1×2,2)=4+1=5

Это оно!


2
Жаль, что это объяснение не было дано в лекции!
Ян Уокер-Спербер

Мне интересно, как мы узнали об этом в курсе без объяснения
причин

6

Если вы используете все линейные и квадратичные функции, общее число должно быть:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

1
Можете ли вы объяснить это немного дальше? ты говоришь xi + xi ^ 2 + xixi? Является ли xi = 100 и xj = 100? почему xi и xi ^ 2 оба равны 100 * 100? Что такое С (100 * 100,2)?
Янцовичи

4
(1) всего 100 * 100 пикселей, если вы используете интенсивность в качестве объектов, всего будет 100 * 100 объектов, то есть XI; и (ii) вы также можете использовать плотность мощности в качестве функции, то есть (xi, xi) или xi. ^ 2, в сумме 100 * 100; наконец (iii) если вы используете корреляции между двумя пикселями, всего будет C пар пикселей, то есть (xi, xj), C - комбинация по математике ( mathworld.wolfram.com/Combination.html )
lennon310

Спасибо, последний вопрос: почему xi = xi ^ 2 в этом контексте?
Янцовичи

Я использовал xi для представления одного пикселя, а xi ^ 2 означает использование пар одного и того же пикселя (xi, xi). Количество отдельных пикселей одинаково для пар одного и того же пикселя. Это никак не связано с интенсивностью пикселей. Извините за путаницу.
lennon310

Тот же вопрос, несколько лет спустя. Разве мы не должны учитывать также возможные значения интенсивности (от 0 до 255)?
albus_c


0

@whuber 50 миллионов приходит, когда у вас есть изображение размером 100 * 100 пикселей. где квадрат (100 * 100) = 100000000 (10 миллионов) и квадрат (100 * 100) / 2 = 5 миллионов. Надеюсь, что это ответы.


Это ответ на комментарий, а не ответ на этот вопрос.
Майкл Р. Черник
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.