Вопросы с тегом «categorical-data»

6
Как заставить R использовать указанный факторный уровень в качестве ссылки в регрессии?
Как я могу сказать R использовать определенный уровень в качестве эталона, если я использую двоичные независимые переменные в регрессии? Просто по умолчанию используется какой-то уровень. lm(x ~ y + as.factor(b)) с b {0, 1, 2, 3, 4}. Скажем, я хочу использовать 3 вместо нуля, который используется R.

6
Панды: преобразование категорий в числа
Предположим, у меня есть фрейм данных со странами, который выглядит так: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако я хочу вместо этого преобразовать их в индексы, чтобы получить cc_index …

3
Преобразовать несколько категориальных столбцов
В моем наборе данных у меня есть два категориальных столбца, которые я хотел бы перечислить. Оба столбца содержат страны, некоторые перекрываются (отображаются в обоих столбцах). Я хотел бы дать одно и то же число в столбцах 1 и 2 для одной и той же страны. Мои данные выглядят примерно так: …
Используя наш сайт, вы подтверждаете, что прочитали и поняли нашу Политику в отношении файлов cookie и Политику конфиденциальности.
Licensed under cc by-sa 3.0 with attribution required.