Когда я открываю машинное обучение, я вижу разные интересные методы, такие как:
- автоматически настраивать алгоритмы с помощью таких методов, как
grid search, - получить более точные результаты за счет комбинации различных алгоритмов одного и того же «типа», это
boosting, - получить более точные результаты за счет сочетания различных алгоритмов (но не тот же самый тип алгоритмов), это
stacking, - и, вероятно, многое другое мне еще предстоит выяснить ...
Мой вопрос заключается в следующем: есть все эти части. Но возможно ли соединить их вместе, чтобы создать алгоритм, который будет принимать в качестве входных данных очищенные данные и выводить хорошие результаты, используя лучшие из всех методов? (Конечно, вероятно, он будет менее эффективен, чем профессиональный ученый, но он будет лучше меня!) Если да, у вас есть примеры кодов или вы знакомы с фреймворками, которые могут это сделать?
РЕДАКТИРОВАТЬ: После некоторых ответов, кажется, что некоторое сужение должно быть сделано. Давайте возьмем пример, у нас есть один столбец с категориальными данными, давайте назовем его, yи мы хотим предсказать его из числовых данных, Xкоторые являются либо фиктивными, либо реальными числовыми данными (высота, температура). Мы предполагаем, что очистка была сделана ранее. Существуют ли алгоритмы, которые могут принимать такие данные и выводить прогноз? (путем тестирования нескольких алгоритмов, их настройки, усиления и т. д.) Если да, то эффективен ли он в вычислительном отношении (выполняются ли вычисления в разумные сроки, если сравнивать с обычным алгоритмом), и есть ли у вас пример кода?
auto.arima(из forecastбиблиотеки) можно лучше, чем люди, - несколько раз упоминал Роб Хиндман в своих выступлениях. Таким образом, есть области, где некоторые виды «автоматического обучения» применяются с успехом.