Cómo agrupar los resultados "restantes" más allá de Top N en "Otros" con pandas

Question

Nov 07, 2013, 01:18 PM

Cómo agrupar los resultados "restantes" más allá de Top N en "Otros" con pandas

Cuando agrupe un marco de datos de pandas por una columna, diga "versión" y que tiene 10 versiones distintas. ¿Cómo se puede trazar el Top 3 (que cubre más del 90%) y colocar los restos pequeños en un "Otro" - Cubeta.

data = array([
              ('Top1', 14),
              ('Top1', 3),
              ('Top1', 2),
              ('Top2', 6),
              ('Top2', 7),
              ('Other1', 1),
              ('Other2', 2),
         ], 
      dtype=[('Version', 'S10'),('Value', '<i4')])
df = DataFrame.from_records(data)
df.groupby('Version').sum()

Esto devuelve:

Value
Version 
Other1   1
Other2   2
Top1     19
Top2     13

Estoy buscando

Value
Version 
Others   
Top1     19
Top2     13

Los nombres de versión Other * y Top * se seleccionan para el ejemplo.

Por supuesto, esto es posible configurando manualmente la categoría a "Otro" después de agrupar y comparar un umbral. Esperaba un atajo.

Respuestas a la pregunta(1)

Preguntas populares

0 la respuesta

Cambio de cuadro de texto de otra clase

0 la respuesta

Cómo evitar que xml.ElementTree de la cadena deje caer commentnode

0 la respuesta

Cuándo usar subprocess.call () o subprocess.Popen (), ejecutando airodump

0 la respuesta

¿Hay problemas con esta solución 'Soft Delete' al usar tablas EAV?

0 la respuesta

Cómo cargar la clave pública RSA desde un archivo en C #

¡Eres muy activo! ¡Es genial!

Cómo agrupar los resultados &quot;restantes&quot; más allá de Top N en &quot;Otros&quot; con pandas

Respuestas a la pregunta(1)

Su respuesta a la pregunta

Preguntas populares

Cómo agrupar los resultados "restantes" más allá de Top N en "Otros" con pandas