многоколоночный факторизация в пандах
Пандыfactorize
Функция присваивает каждому уникальному значению в серии последовательный индекс на основе 0 и вычисляет, к какому индексу принадлежит каждая запись в серии.
Я хотел бы сделать эквивалентpandas.factorize
на нескольких столбцах:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
То есть я хочу определить каждый уникальный набор значений в нескольких столбцах фрейма данных, назначить последовательный индекс каждому и вычислить, к какому индексу относится каждая строка в фрейме данных.
Factorize
работает только на отдельных столбцах. Есть ли в пандах многостолбцовая эквивалентная функция?