GroupBy funciona en Python Pandas como SUM (col_1 * col_2), promedio ponderado, etc.

Question

Apr 04, 2012, 12:38 PM

¿Es posible calcular directamente el producto (o, por ejemplo, la suma) de dos columnas sin usar

<code>grouped.apply(lambda x: (x.a*x.b).sum()
</code>

Es mucho más rápido (menos de la mitad del tiempo en mi máquina) de usar

<code>df['helper'] = df.a*df.b
grouped= df.groupby(something)
grouped['helper'].sum()
df.drop('helper', axis=1)
</code>

Pero realmente no me gusta tener que hacer esto. Es útil, por ejemplo, calcular el promedio ponderado por grupo. Aquí el enfoque lambda sería

<code>grouped.apply(lambda x: (x.a*x.b).sum()/(df.b).sum())
</code>

y nuevamente es mucho más lento que dividir el ayudante por b.sum ().

Respuestas a la pregunta(3)

Haga clic en la ventana emergente y las cookies (Mostrar ventana emergente una vez)

Interrumpiendo sobre un vector de funciones en MATLAB

PDO se une n veces el mismo valor con foreach

Flask y Werkzeug: prueba de una solicitud de publicación con encabezados personalizados

¿Cómo muestro la primera letra en mayúscula?