Suchergebnisse für Anfrage "dataframe"

2 die antwort

Daten mit demselben Schlüssel zu einer Zeile zusammenführen [duplizieren]

Diese Frage hat hier bereits eine Antwort: Wie kann man Daten vom Lang- zum Breitformat umformen? [/questions/5890584/how-to-reshape-data-from-long-to-wide-format] 9 answersIch habe einen Datenrahmen mit mehreren Daten wie diesen Key A B C 1 1 ...

6 die antwort

Wie kann ich eine tsv-Datei mit großen Datenmengen vorverarbeiten und in einen Python-Datenrahmen laden?

Ich versuche gerade, die folgende große tabulatorgetrennte Datei in eine datenrahmenähnliche Struktur in Python zu importieren --- natürlich verwende ichpandas Datenrahmen, obwohl ich offen für andere Optionen bin. Diese Datei hat eine Größe ...

6 die antwort

Wie erstelle ich eine neue Spalte basierend auf mehreren Bedingungen aus mehreren Spalten?

Ich versuche, einem Datenrahmen eine neue Spalte hinzuzufügen, basierend auf mehreren Bedingungen aus anderen Spalten. Ich habe folgende Daten: > commute <- c("walk", "bike", "subway", "drive", "ferry", "walk", "bike", "subway", "drive", ...

TOP-Veröffentlichungen

14 die antwort

So verketten Sie mehrere Spaltenwerte in einer einzelnen Spalte in Panda DataFrame

Diese Frage ist gleich zuthis posted [https://stackoverflow.com/questions/11858472/pandas-combine-string-and-int-columns] vorhin. Ich möchte drei Spalten verketten, anstatt zwei Spalten zu verketten: Hier ist die Kombination zweier Spalten: df ...

2 die antwort

Warum stört es die Untermenge nicht, wenn Untermengenargumente für Datenrahmen fehlen?

Normalerweise frage ich mich, woher mysteriöse Fehler kommen, aber jetzt ist meine Frage, woher ein mysteriöser Mangel an Fehlern kommt. Lasse numbers <- c(1, 2, 3) frame <- as.data.frame(numbers)Wenn ich @ einge subset(numbers, ) (also möchte ...

4 die antwort

entfernen Sie bestimmte Zeilen im Datenrahmen mit pandas

Ich brauche Hilfe von euch allen Ich arbeite mit einem Datenformular von Excel, also habe ich im Grunde jetzt so etwas. csr id ac otc tm lease maint 1 456 b 0 0 0 0 1 543 a 0 1 1 0 1 435 e 0 0 0 0 2 123 w 1 1 1 1 2 123 g 0 0 0 0 3 987 j 0 0 0 0 ...

2 die antwort

Anzahl der Partitionen von Spark Dataframe

Kann jemand erklären, wie viele Partitionen für einen Spark-Datenrahmen erstellt werden. Ich weiß, dass wir beim Erstellen einer RDD die Anzahl der Partitionen wie folgt angeben können. val RDD1 = sc.textFile("path" , 6)Aber für ...

6 die antwort

So ordnen Sie IDs schnell aufeinanderfolgenden Nummern zu

Ich habe eine große CSV-Datei mit Zeilen, die wie folgt aussehen: stringa,stringb stringb,stringc stringd,stringaIch muss es konvertieren, damit die IDs fortlaufend von 0 nummeriert werden. In diesem Fall würde das folgende funktionieren 0,1 ...

2 die antwort

Hinzufügen einer nach zscore gruppierten Spalte zu einem Pandas-Datenframe

Ich kann eine Spalte in einen Datenrahmen einfügen, der eine andere Spalte wie diese z-bewertet: [1] df.insert(<loc>, column='ZofA', value=(df['A']-df['A'].mean())/df['A'].std())Ich kann eine Spalte, die durch 2 andere Spalten gruppiert ist, ...

4 die antwort

Wie filtere ich Spark-Datenrahmen, wenn eine Spalte Mitglied einer anderen Spalte ist?

Ich habe einen Datenrahmen mit zwei Spalten (eine Zeichenfolge und ein Array von Zeichenfolge): root |-- user: string (nullable = true) |-- users: array (nullable = true) | |-- element: string (containsNull = true)Wie kann ich den Datenrahmen so ...