многоколоночный факторизация в пандах

Question

May 09, 2013, 04:39 AM

python enumeration pandas data-cleansing

многоколоночный факторизация в пандах

Пандыfactorize Функция присваивает каждому уникальному значению в серии последовательный индекс на основе 0 и вычисляет, к какому индексу принадлежит каждая запись в серии.

Я хотел бы сделать эквивалентpandas.factorize на нескольких столбцах:

import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]

То есть я хочу определить каждый уникальный набор значений в нескольких столбцах фрейма данных, назначить последовательный индекс каждому и вычислить, к какому индексу относится каждая строка в фрейме данных.

Factorize работает только на отдельных столбцах. Есть ли в пандах многостолбцовая эквивалентная функция?

многоколоночный факторизация в пандах

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

многоколоночный факторизация в пандах

Ответы на вопрос(4)

Ваш ответ на вопрос

Популярные вопросы