Suchergebnisse für Anfrage "dataframe"

6 die antwort

Mischen Sie zwei Python-Pandas-Datenframes unterschiedlicher Länge, aber behalten Sie alle Zeilen im Ausgabedatenframe @ be

Ich habe das folgende Problem: Ich habe zwei Pandadatenframes unterschiedlicher Länge, die einige Zeilen und Spalten mit gemeinsamen Werten und einige mit unterschiedlichen Werten enthalten: df1: df2: Column1 Column2 Column3 ColumnA ColumnB ...

8 die antwort

Ist es möglich, Reihen an DataFrame-Zeilen anzuhängen, ohne zuerst eine Liste zu erstellen?

Ich habe einige Daten, die ich versuche, in ein @ zu organisierDataFrame imPandas. Ich habe versucht, jede Zeile zu einem @ zu machSeries und an das @ anhängDataFrame. Ich habe einen Weg gefunden, dies zu tun, indem ich das @ angefügt habSeries ...

16 die antwort

Wie teile ich einen Datenrahmen auf?

Ich möchte einen Datenrahmen in mehrere kleinere aufteilen. Dies scheint eine sehr triviale Frage zu sein, ich kann jedoch keine Lösung aus der Websuche finden.

TOP-Veröffentlichungen

2 die antwort

Mehrere verschiedene Spalten mit Spark Dataframe-Scala in Map-Spalten konvertieren

Ich habe einen Datenrahmen mit der Spalte:user, address1, address2, address3, phone1, phone2 und so weiter. Ich möchte diesen Datenrahmen in - @ konvertieruser, address, phone where address = Map("address1" -> address1.value, "address2" -> ...

6 die antwort

R: XML-Daten in Datenrahmen konvertieren

Für eine Hausaufgabe versuche ich, eine XML-Datei in einen Datenrahmen in R umzuwandeln. Ich habe viele verschiedene Dinge ausprobiert und im Internet nach Ideen gesucht, war aber erfolglos. Hier ist mein Code soweit: library(XML) url <- ...

2 die antwort

Wie verarbeitet Spark DataFrame Pandas DataFrame, der größer als der Speicher ist

Ich lerne gerade Spark und es scheint die Big-Data-Lösung für Pandas Dataframe zu sein, aber ich habe diese Frage, die mich unsicher macht. Gegenwärtig speichere ich Pandas-Datenrahmen, die größer als der Speicher sind, mit HDF5. HDF5 ist ein ...

4 die antwort

Python: Ermittelt eine Häufigkeitszählung basierend auf zwei Spalten (Variablen) in Pandas-Datenrahmen. Einige Zeilen werden hinzugefügt.

Hallo, ich habe den folgenden Datenrahmen. Group Size Short Small Short Small Moderate Medium Moderate Small Tall LargeIch möchte zählen, wie oft dieselbe Zeile im Datenrahmen angezeigt wird. Group Size Time Short Small 2 Moderate Medium 1 ...

4 die antwort

python pandas - Erstellt eine Spalte, die eine fortlaufende Anzahl aufeinanderfolgender Werte enthält.

Ich versuche, eine Spalte ("consec") zu erstellen, die eine fortlaufende Anzahl aufeinanderfolgender Werte in einer anderen ("binary") ohne Verwendung einer Schleife enthält. So würde das gewünschte Ergebnis aussehen: . binary consec 1 0 0 2 1 ...

6 die antwort

In R, wie können Sie die Zeilen eines Datenrahmens wirklich schnell durchlaufen?

Angenommen, Sie haben einen Datenrahmen mit vielen Zeilen und vielen Spalten. Die Spalten haben Namen. Sie möchten über die Nummer auf die Zeilen und über den Namen auf die Spalten zugreifen. Zum Beispiel ist @ eine (möglicherweise langsame) ...

4 die antwort

Nullwerte in Spark DataFrame ersetzen

Ich habe hier eine Lösung gesehen, aber als ich es ausprobiert habe, funktioniert es bei mir nicht. Zunächst importiere ich eine cars.csv-Datei: val df = sqlContext.read .format("com.databricks.spark.csv") .option("header", "true") ...