Beschreibende Statistiken aus der Häufigkeitstabelle in Pandas

Question

Sep 18, 2016, 04:52 PM

Beschreibende Statistiken aus der Häufigkeitstabelle in Pandas

Ich habe eine Häufigkeitstabelle mit Testergebnissen:

score    count
-----    -----
  77      1105
  78       940
  79      1222
  80      4339
etc

Ich möchte grundlegende Statistiken und einen Boxplot für die Stichprobe anzeigen, der in der Häufigkeitstabelle zusammengefasst ist. (Der Mittelwert des obigen Beispiels beträgt beispielsweise 79,16 und der Median 80.)

ibt es eine Möglichkeit, dies in Pandas zu tun? Alle Beispiele, die ich gesehen habe, gehen von einer Einzelfalltabelle aus.

Ich nehme an, ich könnte eine Liste von Einzelbewertungen wie folgt erstellen -

In [2]: s = pd.Series([77] * 1105 + [78] * 940 + [79] * 1222 + [80] * 4339)
In [3]: s.describe()
Out[3]: 
count    7606.000000
mean       79.156324
std         1.118439
min        77.000000
25%        78.000000
50%        80.000000
75%        80.000000
max        80.000000
dtype: float64

- aber ich hoffe, das zu vermeiden; Die Gesamthäufigkeiten im realen Nicht-Spielzeug-Datensatz liegen deutlich über den Milliardenwerten.

Jede Hilfe geschätzt.

(Ich denke, das ist eine andere Frage alsBenutzen von describe () mit gewichteten Daten, bei dem es darum geht, Gewichte auf Einzelfälle anzuwenden.)