Как посчитать повторяющиеся строки в кадре данных панд?

Question

Feb 23, 2016, 06:21 PM

Как посчитать повторяющиеся строки в кадре данных панд?

Я пытаюсь подсчитать дубликаты строк каждого типа в моем фрейме данных. Например, скажите, что у меня есть датафрейм в пандах следующим образом:

df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
                   'two': pd.Series([1., 2., 1])})

Я получаю df, который выглядит так:

Я предполагаю, что первый шаг - найти все уникальные строки, которые я делаю:

df.drop_duplicates()

Это дает мне следующий df:

    one two
0   1   1
1   1   2

Теперь я хочу взять каждую строку из вышеупомянутого df ([1 1] и [1 2]) и получить счетчик того, сколько раз каждый находится в начальном df. Мой результат будет выглядеть примерно так:

Row     Count
[1 1]     2
[1 2]     1

Как мне сделать этот последний шаг?

Редактировать:

Вот более крупный пример, чтобы сделать его более понятным:

df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
                   'two': pd.Series([True, False, False, True]),
                   'three': pd.Series([True, False, False, False])})

дает мне:

    one three   two
0   True    True    True
1   True    False   False
2   True    False   False
3   False   False   True

Я хочу результат, который говорит мне:

       Row           Count
[True True True]       1
[True False False]     2
[False False True]     1

Как посчитать повторяющиеся строки в кадре данных панд?

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Как посчитать повторяющиеся строки в кадре данных панд?

Ответы на вопрос(5)

Ваш ответ на вопрос

Популярные вопросы