@ Темно, это правда. Единственная причина, по которой вы выбрали бы это решение вместо факторизации, заключается в том, что вы намереваетесь использовать категориальные функции (например, валидацию), а представление кода - это просто альтернативное представление.
отрим следующий кадр данных:
import pandas as pd
from sklearn.preprocessing import LabelEncoder
df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"])
df = df.apply(LabelEncoder().fit_transform)
print(df)
В настоящее время выводит:
a b c
0 0 1 0
1 1 0 0
Моя цель - заставить его выводить что-то вроде этого, передавая столбцы, которые я хочу разделить категориальными значениями:
a b c
0 0 1 2
1 1 0 2