Когда я открываю машинное обучение, я вижу разные интересные методы, такие как:
- автоматически настраивать алгоритмы с помощью таких методов, как
grid search
, - получить более точные результаты за счет комбинации различных алгоритмов одного и того же «типа», это
boosting
, - получить более точные результаты за счет сочетания различных алгоритмов (но не тот же самый тип алгоритмов), это
stacking
, - и, вероятно, многое другое мне еще предстоит выяснить ...
Мой вопрос заключается в следующем: есть все эти части. Но возможно ли соединить их вместе, чтобы создать алгоритм, который будет принимать в качестве входных данных очищенные данные и выводить хорошие результаты, используя лучшие из всех методов? (Конечно, вероятно, он будет менее эффективен, чем профессиональный ученый, но он будет лучше меня!) Если да, у вас есть примеры кодов или вы знакомы с фреймворками, которые могут это сделать?
РЕДАКТИРОВАТЬ: После некоторых ответов, кажется, что некоторое сужение должно быть сделано. Давайте возьмем пример, у нас есть один столбец с категориальными данными, давайте назовем его, y
и мы хотим предсказать его из числовых данных, X
которые являются либо фиктивными, либо реальными числовыми данными (высота, температура). Мы предполагаем, что очистка была сделана ранее. Существуют ли алгоритмы, которые могут принимать такие данные и выводить прогноз? (путем тестирования нескольких алгоритмов, их настройки, усиления и т. д.) Если да, то эффективен ли он в вычислительном отношении (выполняются ли вычисления в разумные сроки, если сравнивать с обычным алгоритмом), и есть ли у вас пример кода?
auto.arima
(из forecast
библиотеки) можно лучше, чем люди, - несколько раз упоминал Роб Хиндман в своих выступлениях. Таким образом, есть области, где некоторые виды «автоматического обучения» применяются с успехом.