Suchergebnisse für Anfrage "pandas"
Wie löscht man eine nicht numerische Spalte aus einem Eingabedatensatz?
Zum Beispiel, wenn ich eine Blumenart, die Anzahl der Blütenblätter, die Keimzeit und den Benutzer berücksichtigen möchteID, der BenutzerID wird dort einen Bindestrich haben. Daher möchte ich meine Datenanalyse nicht verwenden. Mir ist bewusst, ...
seaborn Zeitreihen von Pandas DataFrame
Ich kämpfe mit einem scheinbar sehr einfachen Problem: Wie man Seeleute dazu bringt, ein Zeitreihen-Liniendiagramm aus einem Pandas-Datenrahmen zu zeichnen. Was mache ich hier falsch? import seaborn as sns import pandas as ...
Ordner mit der Erweiterung .gl in Python oder Pandas öffnen
Ich habe einige Daten von einem Online-Kurs heruntergeladen, den ich verfolge. Once entpackt generiert einen Ordner namens home.gl (der Ordner wird mit der Erweiterung gl geliefert) und in diesem Ordner befinden sich diese ...
So wählen Sie zeilenbasierte Kategorien in Pandas DataFrame aus
dies ist wirklich trivial, aber ich kann nicht glauben, dass ich eine Stunde herumgewandert bin und immer noch die Antwort finden kann, also hier bist du: df = pd.DataFrame({"cats":["a","b"], "vals":[1,2]}) df.cats = df.cats.astype("category") ...
python - Verwenden von Pandastrukturen mit großem csv (iterate und chunksize)
Ich habe eine große CSV-Datei, ungefähr 600 MB mit 11 Millionen Zeilen, und ich möchte statistische Daten wie Pivots, Histogramme, Diagramme usw. erstellen. Offensichtlich versuche ich, sie nur normal zu lesen: df = ...
Größer / kleiner als Vergleiche zwischen Pandas DataFrames / Series
Wie kann ich Vergleiche zwischen DataFrames und Serien durchführen? Ich möchte Elemente in einem DataFrame / einer Serie maskieren, die größer / kleiner als Elemente in einem anderen DataFrame / einer anderen Serie sind. Zum Beispiel ersetzt das ...
Pandas Groupby mit sum () auf große CSV-Datei?
Ich habe eine große Datei (ca. 19 GB), die ich in den Speicher laden möchte, um eine Aggregation über einige Spalten durchzuführen. die Datei sieht so aus: id, col1, col2, col3, 1 , 12 , 15 , 13 2 , 18 , 15 , 13 3 , 14 , 15 , 13 3 , 14 , 185 , ...
Kann nicht fallen NAN mit Dropna in Pandas
Ich importiere Pandas als pd und führe den folgenden Code aus und erhalte das folgende Ergebnis Code traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...
Erstellen einer neuen Spalte in Panda mithilfe der Lambda-Funktion für zwei vorhandene Spalten
Ich kann eine neue Spalte in Panda hinzufügen, indem ich die Benutzerfunktion definiere und dann Apply benutze. Ich möchte dies jedoch mit @ t Lambda; Gibt es einen Ausweg? Zum Beispiel,df hat zwei Spaltena undb. Ich möchte eine neue Spalte ...
Python-Pandas Ersetzen Sie NA durch den Median oder den Mittelwert einer Gruppe in dataframe
Angenommen, wir haben ein df: A B apple 1.0 apple 2.0 apple NA orange NA orange 7.0 melon 14.0 melon NA melon 15.0 melon 16.0, um die NA zu ersetzen, können wir df ["B"]. fillna (df ["B"]. median ()) verwenden, aber es wird NA mit dem Median ...