Я хотел бы проверить мою обученную модель на несбалансированном наборе данных. Есть ли какие-либо алгоритмы для генерации синтетических данных из сбалансированного помеченного набора данных (спам / не спам)?
Вы всегда можете разбалансировать любой набор данных, просто сократив выборку одного класса.
—
user2974951