Сверточные сети (CNN) основаны на математической свертке (например, 2D или 3D свертки), которая обычно используется для обработки сигналов. Изображения являются типом сигнала, и свертка может в равной степени использоваться для звука, вибраций и т. Д. Таким образом, в принципе, CNN могут найти применение для любого сигнала и, возможно, даже больше.
На практике уже существует работа над НЛП (как упомянул Мэттью Грейвс), где некоторые люди обрабатывают текст с помощью CNN, а не рекурсивных сетей. Некоторые другие работы относятся к обработке звука (здесь нет ссылок, но я еще не опубликовал работы).
Исходное содержание: В ответ на первоначальный заглавный вопрос, который изменился сейчас. Возможно, нужно удалить этот .
Исследования противоборствующих сетей (и связанных с ними) показывают, что даже глубокие сети можно легко одурачить , что приведет к тому, что они увидят собаку (или любой другой объект) в том, что кажется случайным шумом, когда человек смотрит на него (в статье есть четкие примеры).
Другая проблема - обобщающая сила нейронной сети. Сверточные сети поразили мир своей способностью обобщать лучше, чем другие методы. Но если в сеть поступают только изображения кошек, она распознает только кошек (и, вероятно, видит кошек повсюду, как показывают результаты состязательной сети). Другими словами, даже КН трудно обобщать слишком далеко от того, чему они научились.
Предел распознавания трудно определить точно. Я бы просто сказал, что разнообразие обучающих данных расширяет границы (я предполагаю, что дальнейшие подробности должны привести к более подходящему месту для обсуждения).