Проблема касается построения деревьев решений. Согласно Википедии « коэффициент Джини » не следует путать с « примесью Джини ». Однако обе меры можно использовать при построении дерева решений - они могут поддержать наш выбор при разделении набора элементов.
1) «примесь Джини» - это стандартная метрика разбиения дерева решений (см. Ссылку выше);
2) «Коэффициент Джини» - каждое разбиение может быть оценено на основе критерия AUC. Для каждого сценария расщепления мы можем построить кривую ROC и вычислить метрику AUC. Согласно Википедии AUC = (GiniCoeff + 1) / 2;
Вопрос: обе эти меры эквивалентны? С одной стороны, мне сообщили, что коэффициент Джини не следует путать с примесью Джини. С другой стороны, обе эти меры можно использовать для выполнения одной и той же задачи - оценки качества разделения дерева решений.