Я пытаюсь обнаружить логотип телевизионного канала внутри видеофайла, поэтому просто с помощью входного .mp4
видео определите, присутствует ли этот логотип в определенном кадре, скажем, в первом кадре, или нет.
У нас есть этот логотип заранее (хотя это может быть не тот же самый размер 100%), и местоположение всегда фиксировано.
У меня уже есть подход, основанный на сопоставлении с образцом. Но для этого требуется, чтобы шаблон был на 100% одинакового размера. Я хотел бы использовать глубокое обучение и нейронную сеть для достижения этой цели. Как я могу это сделать? Я считаю, что CNN может иметь более высокую эффективность?