Я имею дело с контролируемой проблемой бинарной классификации. Я хотел бы использовать пакет GBM для классификации людей как незараженных / зараженных. У меня в 15 раз больше незараженных, чем у инфицированных.
Мне было интересно, страдают ли модели GBM в случае несбалансированных размеров классов? Я не нашел никаких ссылок на этот вопрос.
Я пытался откорректировать вес, назначив вес 1 для неинфицированных лиц и вес 15 для инфицированных, но я получил плохие результаты.