У меня есть датафрейм с большими категориальными значениями более 1600 категорий, есть ли способ найти альтернативы, чтобы у меня не было более 1600 столбцов.
Я нашел эту интересную ссылку ниже http://amunategui.github.io/feature-hashing/#sourcecode
Но они конвертируются в класс / объект, который я не хочу. Я хочу, чтобы мой конечный результат был в виде фрейма данных, чтобы я мог тестировать на разных моделях машинного обучения? или я могу использовать генетическую матрицу для обучения другим моделям машинного обучения, кроме логистической регрессии или XGBoost?
Есть ли способ, который я могу реализовать?