Pandas Aggregation ignoriert NaN's

Question

Oct 01, 2014, 06:01 PM

Pandas Aggregation ignoriert NaN's

Ich aggregiere meinen Pandas-Datenrahmen:data. Insbesondere möchte ich den Durchschnitt und die Summe @ erhaltamounts durch Tupel von origin undtype]. Zum Mitteln und Summieren habe ich die folgenden Zahlenfunktionen ausprobiert:

import numpy as np
import pandas as pd
result = data.groupby(groupbyvars).agg({'amount': [ pd.Series.sum, pd.Series.mean]}).reset_index()

Mein Problem ist, dass dasamount Spalte enthältNaNs, wodurch dasresult des obigen Codes, um viel @ zu habNaN Durchschnitt und Summe.

Ich kenne beidepd.Series.sum undpd.Series.mean habenskipna=True standardmäßig, also warum bekomme ich immer nochNaNs hier?

Ich habe es auch versucht, was offensichtlich nicht funktioniert hat:

data.groupby(groupbyvars).agg({'amount': [ pd.Series.sum(skipna=True), pd.Series.mean(skipna=True)]}).reset_index()

BEARBEITEN Auf @ Korems Vorschlag habe ich auch versucht, ein @ zu verwendpartial wie nachstehend

s_na_mean = partial(pd.Series.mean, skipna = True)    
data.groupby(groupbyvars).agg({'amount': [ np.nansum, s_na_mean ]}).reset_index()

aber diesen Fehler bekommen:

error: 'functools.partial' object has no attribute '__name__'

Antworten auf die Frage(1)

Top Fragen

0 die antwort

Firefox-Fehler: Eingabe kann nicht überprüft werden, da das Muster kein gültiger regulärer Ausdruck ist: ungültige Identitätsflucht im regulären Ausdruck

0 die antwort

Validierung von E-Mails mit regulärem Ausdruck VB.Net

0 die antwort

GridBagLayout: gleichmäßig verteilte Zellen

0 die antwort

So senden Sie eine Nachricht in einem reaktiven Stream von einem Abonnenten an einen Herausgeber in einer Web-Socket-Verbindung

0 die antwort

PHP prüfe Wert gegen mehrere Werte mit OR-Operator