Google использует различные методы и алгоритмы машинного обучения для обучения и прогнозирования. Стратегии крупномасштабного контролируемого обучения: 1. Подвыборка 2. Неловко распараллеливать некоторые алгоритмы 3. Распределенный градиентный спуск 4. Голосование большинством 5. Смешение параметров 6. Сочетание итерационных параметров
Они должны обучать и прогнозировать модель с помощью различных методов машинного обучения и использования алгоритма для определения наилучшей модели и прогнозирования для возвращения.
- Подвыборка обеспечивает низкую производительность
- Смесь параметров улучшается, но не так хорошо, как все данные
- Распределенные алгоритмы возвращают лучшие классификаторы быстрее
- Итеративное смешение параметров достигает такого же уровня, как и все данные
Но, конечно, это не совсем понятно в документации API.