Предположим, у меня есть фрейм данных со странами, который выглядит так:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако я хочу вместо этого преобразовать их в индексы, чтобы получить cc_index = [1,2,1,3]
вместо них.
Я предполагаю, что есть более быстрый способ, чем использование get_dummies вместе с предложением numpy where, как показано ниже:
[np.where(x) for x in df.cc.get_dummies().values]
Это несколько проще сделать в R, используя «факторы», поэтому я надеюсь, что у панд есть что-то похожее.
cc_index = [0,1,0,2]
?