У меня есть набор данных, который имеет атрибут бинарного класса. Имеется 623 случая с классом +1 (рак положительный) и 101 671 случай с классом -1 (рак отрицательный).
Я пробовал различные алгоритмы (Наивный Байес, Случайный лес, AODE, C4.5), и все они имеют недопустимые ложноотрицательные отношения. Случайный лес имеет наивысшую общую точность прогноза (99,5%) и самое низкое соотношение ложных отрицательных результатов, но все же не соответствует 79% положительных классов (т. Е. Не обнаруживает 79% злокачественных опухолей).
Есть идеи, как я могу улучшить эту ситуацию?
Спасибо!