Какие методы используют алгоритмы обучения дерева решений для обработки пропущенных значений.
Они просто заполняют слот при использовании значения, называемого отсутствующим?
Благодарю.
Какие методы используют алгоритмы обучения дерева решений для обработки пропущенных значений.
Они просто заполняют слот при использовании значения, называемого отсутствующим?
Благодарю.
Ответы:
Существует несколько методов, используемых различными деревьями решений. Простое игнорирование пропущенных значений (как это делает ID3 и другие старые алгоритмы) или трактовка пропущенных значений как другой категории (в случае номинальной характеристики) не являются реальной обработкой пропущенных значений. Однако эти подходы использовались на ранних этапах разработки дерева решений.
Реальные подходы к обработке пропущенных данных не используют точку данных с пропущенными значениями при оценке разбиения. Однако когда дочерние узлы создаются и обучаются, эти экземпляры как-то распределяются.
Я знаю о следующих подходах к распространению экземпляров отсутствующих значений на дочерние узлы: