Панды: конвертировать категории в числа
Предположим, у меня есть датафрейм со странами, который выглядит следующим образом:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Я знаю, что есть функция pd.get_dummies для преобразования стран в «горячие кодировки». Однако я хочу вместо этого преобразовать их в индексы, чтобы получитьcc_index = [1,2,1,3]
вместо.
Я предполагаю, что есть более быстрый способ, чем использование get_dummies вместе с предложением numpy where, как показано ниже:
[np.where(x) for x in df.cc.get_dummies().values]
Это немного проще сделать в R, используя «факторы», поэтому я надеюсь, что у панд есть нечто подобное.