У меня есть набор данных, который содержит как категориальные переменные, так и непрерывные переменные. Мне посоветовали преобразовать категориальные переменные как двоичные переменные для каждого уровня (т. Е. A_level1: {0,1}, A_level2: {0,1}) - я думаю, некоторые назвали это «фиктивными переменными».
С учетом вышесказанного, будет ли вводить в заблуждение центрирование и масштабирование всего набора данных с новыми переменными? Кажется, что я бы потерял значение «вкл / выкл» переменных.
Если это вводит в заблуждение, означает ли это, что я должен центрировать и масштабировать непрерывные переменные отдельно, а затем повторно добавить его в мой набор данных?
ТИА.