Чтобы использовать SVM или нейронную сеть, необходимо преобразовать (закодировать) категориальные переменные в числовые переменные. Обычный метод в этом случае - использовать 0-1 двоичные значения с k-ным категориальным значением, преобразованным в (0,0, .. ., 1,0, ... 0) (1 находится в k-й позиции). Существуют ли другие способы сделать это, особенно когда существует большое количество категориальных значений (например, 10000), так что представление 0-1 представит большое количество дополнительных измерений (входных единиц) в нейронной сети, что кажется не совсем желательным или ожидаемым ?
Я спрашиваю об общих стратегиях.