Funções GroupBy em Pandas Python como SUM (col_1 * col_2), média ponderada, etc.

Question

Apr 04, 2012, 12:38 PM

É possível calcular diretamente o produto (ou, por exemplo, a soma) de duas colunas sem usar

<code>grouped.apply(lambda x: (x.a*x.b).sum()
</code>

É muito (menos da metade do tempo na minha máquina) mais rápido de usar

<code>df['helper'] = df.a*df.b
grouped= df.groupby(something)
grouped['helper'].sum()
df.drop('helper', axis=1)
</code>

Mas eu realmente não gosto de ter que fazer isso. Por exemplo, é útil calcular a média ponderada por grupo. Aqui a abordagem lambda seria

<code>grouped.apply(lambda x: (x.a*x.b).sum()/(df.b).sum())
</code>

e novamente é muito mais lento que dividir o ajudante por b.sum ().

questionAnswers(3)

Hierarquia de Árvore do SQL Server e Conjuntos Aninhados com IDs de Registro Duplicados

Como passar array multi-dimensional com post Jquery AJAX?

O que é o elemento DOM?

Validação de entrada de data manual para a opção jQuery UI Datepicker maxDate

Como obter o ícone do arquivo correspondente no Android?