GroupBy-Funktionen in Python Pandas wie SUM (col_1 * col_2), gewichteter Durchschnitt usw

Question

Apr 04, 2012, 12:38 PM

GroupBy-Funktionen in Python Pandas wie SUM (col_1 * col_2), gewichteter Durchschnitt usw

Ist es möglich, das Produkt (oder zum Beispiel die Summe) von zwei Spalten ohne Verwendung von direkt zu berechnen?

<code>grouped.apply(lambda x: (x.a*x.b).sum()
</code>

Es ist viel (weniger als die Hälfte der Zeit auf meinem Computer) schneller zu bedienen

<code>df['helper'] = df.a*df.b
grouped= df.groupby(something)
grouped['helper'].sum()
df.drop('helper', axis=1)
</code>

Aber ich mag es nicht wirklich, das zu tun. Es ist beispielsweise nützlich, den gewichteten Durchschnitt pro Gruppe zu berechnen. Hier wäre der Lambda-Ansatz

<code>grouped.apply(lambda x: (x.a*x.b).sum()/(df.b).sum())
</code>

und wieder ist es viel langsamer, als den Helfer durch b.sum () zu teilen.

Antworten auf die Frage(3)

Top Fragen

0 die antwort

Wie werden Tags mit acts_as_taggable_on zwischengespeichert?

0 die antwort

LINQ-to-SQL-Vergleichselemente in ein einzelnes Vergleichselement zusammenfassen

0 die antwort

Benutzerdefinierte Oracle-Typen über DBLINK referenzieren?

0 die antwort

Wie greife ich auf Android-Handys auf die Kamera zu?

0 die antwort

Wie verweise ich richtig auf die GNU-Readline-Bibliothek, um die Terminal-Eingabe zu scannen?

Du bist sehr aktiv! Es ist großartig!

GroupBy-Funktionen in Python Pandas wie SUM (col_1 * col_2), gewichteter Durchschnitt usw

Antworten auf die Frage(3)

Ihre Antwort auf die Frage

Top Fragen