¿Cómo contar filas duplicadas en el marco de datos de pandas?

Question

Feb 23, 2016, 06:21 PM

¿Cómo contar filas duplicadas en el marco de datos de pandas?

Estoy tratando de contar los duplicados de cada tipo de fila en mi marco de datos. Por ejemplo, digamos que tengo un marco de datos en pandas de la siguiente manera:

df = pd.DataFrame({'one': pd.Series([1., 1, 1]),
                   'two': pd.Series([1., 2., 1])})

Me sale un df que se ve así:

Me imagino que el primer paso es encontrar todas las filas únicas diferentes, lo que hago por:

df.drop_duplicates()

Esto me da el siguiente df:

    one two
0   1   1
1   1   2

Ahora quiero tomar cada fila del df anterior ([1 1] y [1 2]) y obtener un recuento de cuántas veces cada uno está en el df inicial. Mi resultado se vería así:

Row     Count
[1 1]     2
[1 2]     1

¿Cómo debo hacer este último paso?

Editar:

Aquí hay un ejemplo más amplio para hacerlo más claro:

df = pd.DataFrame({'one': pd.Series([True, True, True, False]),
                   'two': pd.Series([True, False, False, True]),
                   'three': pd.Series([True, False, False, False])})

me da

    one three   two
0   True    True    True
1   True    False   False
2   True    False   False
3   False   False   True

Quiero un resultado que me diga:

       Row           Count
[True True True]       1
[True False False]     2
[False False True]     1

Respuestas a la pregunta(5)

Preguntas populares

0 la respuesta

¿Cómo escapar barras diagonales en expresiones regulares?

0 la respuesta

CSS - centro de dos imágenes en css lado a lado

0 la respuesta

Android: FileObserver solo supervisa el directorio superior

0 la respuesta

ListFragment Elemento seleccionado Fondo

0 la respuesta

Programación USB con Qt

¡Eres muy activo! ¡Es genial!

¿Cómo contar filas duplicadas en el marco de datos de pandas?

Respuestas a la pregunta(5)

Su respuesta a la pregunta

Preguntas populares