Suchergebnisse für Anfrage "dataframe"

10 die antwort

Wie entferne ich mehrere Spalten, die in Pandas mit demselben Text enden?

Ich versuche, eine Gruppe von Spalten aus einem Datensatz zu entfernen. Alle zu entfernenden Variablen enden mit dem Text "Präfix". Ich habe es geschafft, sie mit den folgenden Mitteln in einer Gruppe zu "sammeln": [/imgs/w8AZ5.jpg] und ...

2 die antwort

Plotting Dataframe column - datetime

Ich habe eine datetime-Spalte mit ziemlich zufälligen Zeitinkrementen. Das Format lautet: time 2016-07-08 11:29:30 2016-07-08 11:30:02 Jetzt konvertiere ich es zu datetime: df['time2'] = pd.to_datetime(df['time'])Dann möchte ich es mit ...

4 die antwort

Wie erstelle ich eine "bedingte" Variable in R?

Ich möchte eine bedingte Dummy-Variable erstellen. Angenommen, ich habe einen Datensatz, der ungefähr so aussieht: Subject Year X X1 A 1990 1 0 A 1991 1 0 A 1992 2 0 A 1993 3 0 A 1994 4 0 A 1995 4 1 B 1990 0 0 B 1991 1 0 B 1992 1 0 B 1993 2 0 B ...

TOP-Veröffentlichungen

4 die antwort

Wie werden alle Zeilen zu einer einzigen Zeile zusammengefasst? [geschlossen

Ich habe einen Datenrahmen mit 100 Zeilen und 10 Spalten. Ich frage mich, wie ich alle 100 Zeilen in einer Zeile zusammenführen kann. Vielen Dank mydata=seq(1,1000) mydata=as.data.frame(matrix(mydata,nrow = 100,ncol = 10,byrow=T)) the result ...

6 die antwort

Retieve top n in jeder Gruppe eines DataFrame in pyspark

Es gibt einen DataFrame in Pyspark mit folgenden Daten: user_id object_id score user_1 object_1 3 user_1 object_1 1 user_1 object_2 2 user_2 object_1 5 user_2 object_2 2 user_2 object_2 6Was ich erwarte, gibt 2 Datensätze in jeder Gruppe mit ...

10 die antwort

Reversing "One-Hot" -Codierung in Pandas

Problemstellun Ich möchte von diesem Datenrahmen ausgehen, der im Grunde ein heißer Code ist. In [2]: pd.DataFrame({"monkey":[0,1,0],"rabbit":[1,0,0],"fox":[0,0,1]}) Out[2]: fox monkey rabbit 0 0 0 1 1 0 1 0 2 1 0 0 3 0 0 0 4 0 0 0Zu dieser, ...

8 die antwort

Dict mit NA-Werten füllen, um die Konvertierung in Pandas-Datenrahmen zu ermöglichen

Ich habe ein Diktat, das berechnete Werte für verschiedene Zeitverzögerungen enthält, was bedeutet, dass sie an verschiedenen Daten beginnen. Zum Beispiel könnten die Daten, die ich habe, wie folgt aussehen: Date col1 col2 col3 col4 col5 ...

2 die antwort

Wie importiere ich eine gzip-Datei, die größer als das RAM-Limit ist, in einen Pandas DataFrame? "9 töten" HDF5 verwenden?

Ich habe eingzip Das sind ungefähr 90 GB. Das liegt zwar im Festplattenspeicher, ist aber weitaus größer als der Arbeitsspeicher. Wie kann ich das in einen Pandas-Datenrahmen importieren? Ich habe Folgendes in der Befehlszeile versucht: # start ...

2 die antwort

Pandas Löschen einer Zeile mit df.drop funktioniert nicht

Ich habe einen DataFrame wie diesen (erste Spalte istindex (786 ...) und zweitesday (25 ...) undRainfall amount ist leer) Day Rainfall amount (millimetres) 786 25 787 26 788 27 789 28 790 29 791 1 792 2 793 3 794 4 795 5und ich möchte die Zeile ...

2 die antwort

Hinzufügen und Umbenennen einer Spalte in einem Multiindex-DataFrame

Der Zweck dieses Beitrags besteht darin, zu verstehen, wie einer Ebene in einem @ eine Spalte hinzugefügt wirMultiIndex.DataFrame usingapply() undshift() Erstelle den DataFrame import pandas as pd df = pd.DataFrame( [ [5777, 100, 5385, 200, ...