Funkcje GroupBy w Pandonie, takie jak SUM (col_1 * col_2), średnia ważona itp

Question

Apr 04, 2012, 12:38 PM

Czy możliwe jest bezpośrednie obliczenie produktu (lub na przykład sumy) dwóch kolumn bez użycia

<code>grouped.apply(lambda x: (x.a*x.b).sum()
</code>

Jest o wiele (mniej niż połowę czasu na moim komputerze) szybsze w użyciu

<code>df['helper'] = df.a*df.b
grouped= df.groupby(something)
grouped['helper'].sum()
df.drop('helper', axis=1)
</code>

Ale tak naprawdę nie lubię tego robić. Przydatne jest na przykład obliczenie średniej ważonej na grupę. Oto podejście lambda

<code>grouped.apply(lambda x: (x.a*x.b).sum()/(df.b).sum())
</code>

i znowu jest dużo wolniejszy niż dzielenie pomocnika przez b.sum ().

questionAnswers(3)

Co stanie się z uchwytem otwartego pliku w Linuksie, jeśli wskazany plik zostanie przeniesiony, usuń

javascript XSLTProcessor czasami nie działa

Przesyłanie strumieniowe filmów z YouTube

Nie rozumiem przyczyny wyjścia

symulowanie zdarzenia naciśnięcia klawisza przy użyciu SendInput z C #