Я хотел бы использовать нейронную сеть для классификации изображений. Я начну с предварительно обученного CaffeNet и обучу его для моего приложения.
Как подготовить входные изображения?
В этом случае все изображения имеют один и тот же объект, но с вариациями (подумайте: контроль качества). Они находятся в несколько разных масштабах / разрешениях / расстояниях / условиях освещения (и во многих случаях я не знаю масштаб). Кроме того, на каждом изображении есть область (известная) вокруг интересующего объекта, которая должна игнорироваться сетью.
Я мог бы (например) обрезать центр каждого изображения, которое гарантированно содержит часть интересующего объекта и ни одну из игнорируемой области; но кажется, что это отбросило бы информацию, а также результаты не были бы действительно такого же масштаба (возможно, 1,5-кратное отклонение).
Увеличение набора данных
Я слышал о создании большего количества обучающих данных по случайным кадрам / зеркалам / и т.д., есть ли стандартный метод для этого? Есть ли какие-либо результаты в отношении того, насколько улучшается точность классификатора?