Как посчитать повторяющиеся строки в кадре данных панд?
Я пытаюсь подсчитать дубликаты строк каждого типа в моем фрейме данных. Например, скажите, что у меня есть датафрейм в пандах следующим образом:
df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
'two': pd.Series([1., 2., 1])})
Я получаю df, который выглядит так:
one two
0 1 1
1 1 2
2 1 1
Я предполагаю, что первый шаг - найти все уникальные строки, которые я делаю:
df.drop_duplicates()
Это дает мне следующий df:
one two
0 1 1
1 1 2
Теперь я хочу взять каждую строку из вышеупомянутого df ([1 1] и [1 2]) и получить счетчик того, сколько раз каждый находится в начальном df. Мой результат будет выглядеть примерно так:
Row Count
[1 1] 2
[1 2] 1
Как мне сделать этот последний шаг?
Редактировать:
Вот более крупный пример, чтобы сделать его более понятным:
df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
'two': pd.Series([True, False, False, True]),
'three': pd.Series([True, False, False, False])})
дает мне:
one three two
0 True True True
1 True False False
2 True False False
3 False False True
Я хочу результат, который говорит мне:
Row Count
[True True True] 1
[True False False] 2
[False False True] 1