¿Cómo contar filas duplicadas en el marco de datos de pandas?
Estoy tratando de contar los duplicados de cada tipo de fila en mi marco de datos. Por ejemplo, digamos que tengo un marco de datos en pandas de la siguiente manera:
df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
'two': pd.Series([1., 2., 1])})
Me sale un df que se ve así:
one two
0 1 1
1 1 2
2 1 1
Me imagino que el primer paso es encontrar todas las filas únicas diferentes, lo que hago por:
df.drop_duplicates()
Esto me da el siguiente df:
one two
0 1 1
1 1 2
Ahora quiero tomar cada fila del df anterior ([1 1] y [1 2]) y obtener un recuento de cuántas veces cada uno está en el df inicial. Mi resultado se vería así:
Row Count
[1 1] 2
[1 2] 1
¿Cómo debo hacer este último paso?
Editar:
Aquí hay un ejemplo más amplio para hacerlo más claro:
df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
'two': pd.Series([True, False, False, True]),
'three': pd.Series([True, False, False, False])})
me da
one three two
0 True True True
1 True False False
2 True False False
3 False False True
Quiero un resultado que me diga:
Row Count
[True True True] 1
[True False False] 2
[False False True] 1