Suchergebnisse für Anfrage "pandas"

12 die antwort

Korrelationsmatrix mit Pandas

Ich habe einen Datensatz mit einer großen Anzahl von Merkmalen, daher ist die Analyse der Korrelationsmatrix sehr schwierig geworden. Ich möchte eine Korrelationsmatrix zeichnen, die wir mit @ erhaltdataframe.corr() -Funktion aus der ...

2 die antwort

So erstellen Sie eine Pivot-Tabelle für extrem große Datenrahmen in Pandas

Ich muss eine Pivot-Tabelle mit 2000 Spalten und ungefähr 30-50 Millionen Zeilen aus einem Datensatz mit ungefähr 60 Millionen Zeilen erstellen. Ich habe versucht, in Blöcken von 100.000 Zeilen zu pendeln, und das funktioniert, aber wenn ich ...

28 die antwort

Wie überprüfe ich, ob ein Wert in einem Pandas DataFrame NaN ist?

Was ist der beste Weg, um in Python Pandas zu überprüfen, ob ein DataFrame einen (oder mehrere) NaN-Werte hat? Ich weiß über die Funktionpd.isnan, dies gibt jedoch einen DataFrame mit booleschen Werten für jedes Element zurück.Dieser ...

TOP-Veröffentlichungen

6 die antwort

Wie kann eine Variable in Pandas als ordinal / kategorisch angegeben werden?

Ich versuche, mit scikit-learn einen Algorithmus für maschinelles Lernen auf einem Datensatz auszuführen. Mein Datensatz enthält einige Funktionen, die Kategorien ähneln. Wie ein Merkmal ist A, dessen Werte 1,2,3 die Qualität von etwas ...

2 die antwort

Pandas, groupby, wobei der Spaltenwert größer als x @ i

Ich habe einen Tisch wie diesen timestamp avg_hr hr_quality avg_rr rr_quality activity sleep_summary_id 1422404668 66 229 0 0 13 78 1422404670 64 223 0 0 20 78 1422404672 64 216 0 0 11 78 1422404674 66 198 0 40 9 78 1422404676 65 184 0 30 3 78 ...

4 die antwort

Wie werden die Spaltenüberschriften des Datenrahmens nach der Vorverarbeitung in scikit-learn beibehalten?

Ich habe einen Pandas-Datenrahmen, der einige Zeilen und Spalten enthält. Jede Spalte hat eine Überschrift. Solange ich Daten in Pandas bearbeite, bleiben meine variablen Header erhalten. Wenn ich jedoch eine Datenvorverarbeitungsfunktion von ...

2 die antwort

Update vorhandene Zeile in der Datenbank von Pandas df

Ich habe eine PostgreSQL-Datenbank. Pandas hat eine 'to_sql'-Funktion, um die Datensätze eines Datenrahmens in eine Datenbank zu schreiben. Ich habe jedoch keine Dokumentation zum Aktualisieren einer vorhandenen Datenbankzeile mit Pandas ...

10 die antwort

Schnelle Haversine-Approximation (Python / Pandas)

Jede Zeile in einem Pandas-Datenframe enthält Lat / Lng-Koordinaten von 2 Punkten. Mit dem folgenden Python-Code dauert die Berechnung der Abstände zwischen diesen beiden Punkten für viele (Millionen) Zeilen sehr lange! Betrachtet man, dass die ...

16 die antwort

Shuffle DataFrame-Zeilen

Ich habe den folgenden DataFrame: Col1 Col2 Col3 Type 0 1 2 3 1 1 4 5 6 1 ... 20 7 8 9 2 21 10 11 12 2 ... 45 13 14 15 3 46 16 17 18 3 ...Der DataFrame wird aus einer CSV-Datei gelesen. Alle Zeilen mitType 1 steht oben, gefolgt von den Zeilen ...

2 die antwort

Namen entfernen, dTyp aus Pandas-Ausgabe

Ich habe eine Ausgabedatei wie diese von einer Pandas-Funktion. Series([], name: column, dtype: object) 311 race 317 gender Name: column, dtype: object Ich versuche, eine Ausgabe nur mit der zweiten Spalte zu erhalten, d. race gender durch ...