Что вы думаете о передискретизации в классификации в целом и алгоритме SMOTE в частности? Почему бы нам не просто применить цену / штраф, чтобы скорректировать дисбаланс в данных класса и любую несбалансированную стоимость ошибок? Для моих целей точность прогноза для будущего набора экспериментальных единиц является конечной мерой.
Для справки, документ SMOTE: http://www.jair.org/papers/paper953.html