Это рифф на первый ответ от Djib2011. Краткий ответ должен быть нет. Длиннее - во-первых, фотографии всегда кодируются как тензор следующим образом. Изображение представляет собой количество пикселей. Если считается, что фотография имеет m строк и n столбцов, каждый пиксель определяется своим расположением строки и столбца, то есть парой (m, n). В частности, есть m * n пикселей, которые очень велики даже для «маленьких» фотографий. Каждый пиксель фотографии кодируется числом от нуля до единицы (интенсивность черноты), если фотография черно-белая. Кодируется тремя числами (интенсивность RGB), если фотография цветная. Таким образом, получается тензор 1xmxn или 3xmxn. Распознавание изображений осуществляется с помощью CNN, которые, используя тот факт, что фотографии не сильно меняются от пикселя к пикселю, сжимаютданные через фильтры и пул. Таким образом, дело в том, что работа CNN заключается в сжатии невероятно большого количества точек данных (или функций) фотографии в меньшее количество значений. Итак, в каком бы формате вы ни начинали, CNN начинает с дальнейшего сжатия данных фотографии. Отсюда и независимость как таковая от размера представления фотографии.
Однако CNN потребует, чтобы все изображения, проходящие через него, имели одинаковый размер. Таким образом, эта зависимость будет меняться в зависимости от того, как изображение сохранено. Кроме того, поскольку разные форматы файлов одинакового размера дают разные значения для их тензоров, нельзя использовать одну и ту же модель CNN для идентификации фотографий, хранящихся разными методами.