Каков наилучший способ классификации подходов, разработанных для решения проблемы класса дисбаланса?
Эта статья разделяет их на:
- Предварительная обработка: включает передискретизацию, недостаточную выборку и гибридные методы,
- Чувствительное к затратам обучение: включает в себя прямые методы и мета-обучение, которые последние делят на пороговые значения и выборку,
- Методы ансамбля: включает в себя чувствительные к стоимости ансамбли и предварительную обработку данных в сочетании с обучением ансамблю.
Вторая классификация:
- Предварительная обработка данных: включает изменение распределения и взвешивание пространства данных. Одноклассное обучение рассматривается как изменение распределения.
- Специальные методы обучения
- Постобработка прогноза: включает пороговый метод и постобработку с учетом затрат
- Гибридные методы:
Третья статья :
- Методы уровня данных
- Методы уровня алгоритма
- Гибридные методы
Последняя классификация также рассматривает корректировку выпуска как независимый подход.
Заранее спасибо.
4
Очень короткий ответ: все они лучшие, а все худшие! Классификация и интеллектуальный анализ данных в целом очень чувствительны к контексту. В этой области нет единого решения, подходящего для всех. Между прочим, наилучший подход, в общих чертах, обычно представляет собой сочетание лучших решений на разных уровнях от выделения признаков до схемы оценки.
—
мок
@mok Спасибо. Не могли бы вы сообщить мне вес класса в классификаторах sklearn, например, логистическая регрессия классифицируется на какую категорию?
—
ebrahimi
@ebrahimi, он должен попадать в уровень алгоритма, потому что только веса корректируются в соответствии с переданным словарем или вычисляются (выводятся) в соответствии со значениями y (класса), а данные остаются нетронутыми.
—
Санджай Кришна
@SanjayKrishna Большое спасибо. В случае первой классификации, это относится к обучению с учетом затрат, не так ли? Кроме того, в случае второй таксономии, она будет классифицироваться на третью категорию, то есть чувствительную к затратам последующую обработку. это правда? Второй ответ на этот вопрос: stackoverflow.com/questions/32492550/… также полезен.
—
Эбрахими