Suchergebnisse für Anfrage "dataframe"

2 die antwort

Wie mache ich 1 mal n Datenrahmen aus Serien in Pandas?

Ich habe einen riesigen Datenrahmen und ich indiziere ihn wie folgt: df.ix[<integer>] Abhängig vom Index hat dies manchmal nur eine Zeile mit Werten. Pandas konvertiert dies automatisch in eine Serie, was, ganz offen gesagt, ärgerlich ist, ...

6 die antwort

So wählen Sie zeilenbasierte Kategorien in Pandas DataFrame aus

dies ist wirklich trivial, aber ich kann nicht glauben, dass ich eine Stunde herumgewandert bin und immer noch die Antwort finden kann, also hier bist du: df = pd.DataFrame({"cats":["a","b"], "vals":[1,2]}) df.cats = df.cats.astype("category") ...

10 die antwort

R: Aggregatspalten eines data.frame

Ich habe ein data.frame, das so aussieht > head(df) Memory Memory Memory Memory Memory Naive Naive 10472501 6.075714 5.898929 6.644946 6.023901 6.332126 8.087944 7.520194 10509163 6.168941 6.495393 5.951124 6.052527 6.404401 7.152890 8.335509 ...

TOP-Veröffentlichungen

6 die antwort

python - Verwenden von Pandastrukturen mit großem csv (iterate und chunksize)

Ich habe eine große CSV-Datei, ungefähr 600 MB mit 11 Millionen Zeilen, und ich möchte statistische Daten wie Pivots, Histogramme, Diagramme usw. erstellen. Offensichtlich versuche ich, sie nur normal zu lesen: df = ...

6 die antwort

Pandas Fehler "Kann nur .str-Accessor mit Zeichenfolgenwerten verwenden"

Ich habe die folgende Eingabedatei: "Name",97.7,0A,0A,65M,0A,100M,5M,75M,100M,90M,90M,99M,90M,0#,0N#,Und ich lese es mit: #!/usr/bin/env python import pandas as pd import sys import numpy as np filename = sys.argv[1] df = ...

6 die antwort

Kann nicht fallen NAN mit Dropna in Pandas

Ich importiere Pandas als pd und führe den folgenden Code aus und erhalte das folgende Ergebnis Code traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...

4 die antwort

Python-Pandas Ersetzen Sie NA durch den Median oder den Mittelwert einer Gruppe in dataframe

Angenommen, wir haben ein df: A B apple 1.0 apple 2.0 apple NA orange NA orange 7.0 melon 14.0 melon NA melon 15.0 melon 16.0, um die NA zu ersetzen, können wir df ["B"]. fillna (df ["B"]. median ()) verwenden, aber es wird NA mit dem Median ...

12 die antwort

Pandas DataFrame: Wie wird description () auf jede Gruppe angewendet und zu neuen Spalten hinzugefügt?

df: name score A 1 A 2 A 3 A 4 A 5 B 2 B 4 B 6 B 8Wollen Sie den folgenden neuen Datenrahmen in der folgenden Form erhalten: name count mean std min 25% 50% 75% max A 5 3 .. .. .. .. .. .. B 4 5 .. .. .. .. .. ..Wie kann man die Informationen ...

4 die antwort

Nested named list to data frame

Ich habe die folgende benannte Liste aus einer Analyse ausgegeben. Der reproduzierbare Code lautet wie folgt: list(structure(c(-213.555409754509, -212.033637890131, -212.029474755074, -211.320398316741, -211.158815833294, -210.470525157849), ...

14 die antwort

In R, Was ist der Unterschied zwischen df [“x”] und df $ x

Wo finde ich Informationen zu den Unterschieden zwischen dem Aufrufen einer Spalte in einem data.frame über: df <- data.frame(x=1:20,y=letters[1:20],z=20:1) df$x df["x"]Sie beide geben die "gleichen" Ergebnisse zurück, aber nicht unbedingt im ...