Beschreibende Statistiken aus der Häufigkeitstabelle in Pandas
Ich habe eine Häufigkeitstabelle mit Testergebnissen:
score count
----- -----
77 1105
78 940
79 1222
80 4339
etc
Ich möchte grundlegende Statistiken und einen Boxplot für die Stichprobe anzeigen, der in der Häufigkeitstabelle zusammengefasst ist. (Der Mittelwert des obigen Beispiels beträgt beispielsweise 79,16 und der Median 80.)
ibt es eine Möglichkeit, dies in Pandas zu tun? Alle Beispiele, die ich gesehen habe, gehen von einer Einzelfalltabelle aus.
Ich nehme an, ich könnte eine Liste von Einzelbewertungen wie folgt erstellen -
In [2]: s = pd.Series([77] * 1105 + [78] * 940 + [79] * 1222 + [80] * 4339)
In [3]: s.describe()
Out[3]:
count 7606.000000
mean 79.156324
std 1.118439
min 77.000000
25% 78.000000
50% 80.000000
75% 80.000000
max 80.000000
dtype: float64
- aber ich hoffe, das zu vermeiden; Die Gesamthäufigkeiten im realen Nicht-Spielzeug-Datensatz liegen deutlich über den Milliardenwerten.
Jede Hilfe geschätzt.
(Ich denke, das ist eine andere Frage alsBenutzen von describe () mit gewichteten Daten, bei dem es darum geht, Gewichte auf Einzelfälle anzuwenden.)