Возможно, более простой случай прояснит ситуацию. Допустим, мы выбрали образец пикселей 1х2 вместо 100х100.
Образцы пикселей с изображения
+----+----+
| x1 | x2 |
+----+----+
Представьте, что при построении нашего обучающего набора мы заметили, что его нельзя легко разделить линейной моделью, поэтому мы решили добавить полиномиальные термины, чтобы лучше соответствовать данным.
Допустим, мы решили построить наши многочлены, включив все интенсивности пикселей и все возможные кратные, которые могут быть сформированы из них.
Поскольку наша матрица мала, давайте перечислим их:
x1, x2, x21, x22, x1×x2, x2×x1
Интерпретируя приведенную выше последовательность функций, можно увидеть, что существует закономерность. Первые два слагаемых, группа 1, являются признаками, состоящими только из интенсивности их пикселей. Следующие два термина после этого, группа 2, являются признаками, состоящими из квадрата их интенсивности. Последние два члена, группа 3, являются произведением всех комбинаций парных (двух) интенсивностей пикселей.
группа 1: x1, x2
группа 2: x21, x22
группа 3: x1×x2, x2×x1
Но подождите, есть проблема. Если вы посмотрите на члены группы 3 в последовательности ( и x 2 × x 1 ), вы заметите, что они равны. Помните наш пример жилья. Представьте, что для одного и того же дома есть две функции: х1 = квадратная метра и х2 = квадратная метра ... Это не имеет никакого смысла! Итак, нам нужно избавиться от дубликата, скажем, произвольно x 2 × x 1 . Теперь мы можем переписать список функций группы три как:x1×x2x2×x1x2×x1
группа 3: x1×x2
Мы считаем функции во всех трех группах и получаем 5.
Но это игрушечный пример. Получим общую формулу для расчета количества объектов. Давайте использовать наши оригинальные группы функций в качестве отправной точки.
sizegroup1+sizegroup2+sizegroup3=m×n+m×n+m×n=3×m×n
Ах! Но нам пришлось избавиться от дубликата товара в группе 3.
Поэтому для правильного подсчета функций для группы 3 нам потребуется способ подсчета всех уникальных парных продуктов в матрице. Что можно сделать с помощью биномиального коэффициента, который является методом подсчета всех возможных уникальных подгрупп размера k из равной или большей группы размера n. Поэтому для правильного подсчета объектов в группе 3 рассчитайте .C(m×n,2)
Таким образом, наша общая формула будет:
m×n+m×n+C(m×n,2)=2m×n+C(m×n,2)
Давайте использовать его для вычисления количества функций в нашем примере с игрушкой:
2×1×2+C(1×2,2)=4+1=5
Это оно!