Как отмечается в комментариях к вашему вопросу, многие люди работают над поиском чего-то лучшего. Хотелось бы ответить на этот вопрос, расширив комментарий, оставленный @josh
Все модели ошибочны, но некоторые полезны (Wiki)
Приведенное выше утверждение является общей истиной, используемой для описания природы статистических моделей. Используя имеющиеся у нас данные, мы можем создавать модели, которые позволяют нам делать полезные вещи, например приближать прогнозируемое значение.
Взять, к примеру, линейную регрессию
Используя ряд наблюдений, мы можем подобрать модель, чтобы дать нам приблизительное значение для зависимой переменной с учетом любого значения (й) для независимой (ых) переменной (ей).
Burnham, KP; Андерсон, Д.Р. (2002), Выбор модели и мультимодель> Вывод: практический информационно-теоретический подход (2-е изд.):
«Модель - это упрощение или приближение реальности, и, следовательно, она не будет отражать всю реальность ... Бокс отметил, что« все модели ошибочны, но некоторые полезны ». Хотя модель никогда не может быть« истиной », модель может ранжироваться от очень полезного, до полезного, до несколько полезного, чтобы, наконец, по существу, бесполезного ".
Отклонения от нашей модели (как видно на рисунке выше) кажутся случайными, некоторые наблюдения находятся ниже линии, а некоторые выше, но наша линия регрессии показывает общую корреляцию. Хотя отклонения в нашей модели кажутся случайными, в реалистичных сценариях будут присутствовать другие факторы, которые вызывают это отклонение. Например, представьте себе, что вы наблюдаете, как машины проезжают перекресток, где они должны повернуть налево или направо, чтобы продолжить движение, причем машины не поворачиваются определенным образом. В то время как мы можем сказать, что направление поворота машины является абсолютно случайным, каждый ли водитель достигает перекрестка и в этот момент принимает случайное решение о том, какой путь повернуть? В действительности они, вероятно, направляются куда-то определенное по определенной причине, и, не пытаясь остановить каждую машину, чтобы спросить их об их аргументации, мы можем только описать их действия как случайные.
Там, где мы можем подобрать модель с минимальным отклонением, насколько мы можем быть уверены, что неизвестная, незамеченная или неизмеримая переменная в какой-то момент не бросит нашу модель? Вызывает ли взмах крыльев бабочки в Бразилии торнадо в Техасе?
Проблема с использованием только линейных и SVN-моделей, о которых вы упомянули, заключается в том, что мы несколько обязаны вручную наблюдать за нашими переменными и тем, как они влияют друг на друга. Затем нам нужно решить, какие переменные важны, и написать алгоритм для конкретной задачи. Это может быть просто, если у нас есть только несколько переменных, но что, если у нас было тысячи? Что если бы мы хотели создать обобщенную модель распознавания изображений, можно ли этого реально достичь с помощью этого подхода?
Глубокое обучение и искусственные нейронные сети (ANN) могут помочь нам создать полезные модели для огромных наборов данных, содержащих огромное количество переменных (например, библиотеки изображений). Как вы упомянули, существует непостижимое количество решений, которые могли бы соответствовать данным с использованием ANN, но действительно ли это число отличается от количества решений, которое нам нужно было бы разработать самостоятельно методом проб и ошибок?
Применение ANN делает большую часть работы за нас, мы можем указать наши входные данные и наши желаемые выходные данные (и настроить их позже для внесения улучшений) и оставить ANN на усмотрение решения. Вот почему ИНС часто называют «черными ящиками» . Из заданного входного сигнала они выводят приближение, однако (в общих чертах) эти приближения не включают подробности того, как они были аппроксимированы.
И поэтому все сводится к тому, какую проблему вы пытаетесь решить, так как проблема будет определять, какой модельный подход является более полезным. Модели не совсем точны, поэтому всегда есть элемент «неправильности», однако, чем точнее ваши результаты, тем они полезнее. Наличие более подробных результатов о том, как было сделано приближение, также может быть полезным, в зависимости от проблемы, оно может быть даже более полезным, чем повышение точности.
Например, если вы рассчитываете кредитный балл лиц, использование регрессии и SVM обеспечивает расчеты, которые можно лучше изучить. Возможность одновременно настраивать модель и объяснять клиентам влияние отдельных независимых переменных на их общий балл очень полезна. ИНС может помочь в обработке большего количества переменных для достижения более точной оценки, но будет ли эта точность более полезной?