Это мои тренировочные данные: 200 000 примеров х 10 000 функций. Итак, моя матрица тренировочных данных - 200 000 x 10 000.
Мне удалось сохранить это в плоском файле без проблем с памятью, сохраняя каждый набор данных один за другим (один пример за другим), поскольку я генерировал функции для каждого примера.
Но теперь, когда я использую Milk , SVM light или любой другой алгоритм машинного обучения, все пытается загрузить все данные обучения в память, а не тренировать их один за другим. Однако у меня просто 8 ГБ ОЗУ, поэтому я не могу так поступить.
Знаете ли вы, что я мог бы обучить алгоритм один набор данных одному набору данных? То есть, чтобы в любой момент во время тренировки у меня был только один набор данных, загруженный в память.