Suchergebnisse für Anfrage "dataframe"

2 die antwort

Zeilen von Pandas DataFrame mit derselben ID verknüpfen

Sagen Sie, ich habe einen Pandas-DataFrame wie: A B id 0 1 1 0 1 2 1 0 2 3 2 1 3 0 2 1Say Ich möchte Zeilen mit derselben ID kombinieren, damit die anderen Elemente in den Zeilen in einer Liste zusammengefasst werden, sodass der obige ...

2 die antwort

Strip- oder Regex-Funktion in Spark 1.3 Dataframe

Ich habe einen Code aus PySpark 1.5, den ich leider rückwärts auf Spark 1.3 portieren muss. Ich habe eine Spalte mit alphanumerischen Elementen, möchte aber nur die Ziffern. Ein Beispiel für die Elemente in 'old_col' von 'df' ist: '125 Bytes' In ...

4 die antwort

Multiple Aggregate-Operationen für dieselbe Spalte eines Spark-Datenrahmens

Ich habe drei Arrays vom Typ string, die folgende Informationen enthalten: groupBy Array: Enthält die Namen der Spalten, nach denen ich meine Daten gruppieren möchte.aggregate Array: enthält Namen von Spalten, die ich aggregieren möchte.rray ...

TOP-Veröffentlichungen

2 die antwort

Manipulieren Sie einen Datenrahmen, in dem für jedes Experiment mehrere Spalten vorhanden sind.

Ich habe viele Sequenzierungsexperimente mit jeweils mehreren Ergebnissen für einige hundert Gene. Wenn die Daten von einem anderen Programm ausgegeben werden, sind sie für mich nicht in einem nützlichen Format, da alle Experimente und jedes ...

4 die antwort

Entfernen Sie Datenspalten basierend auf den Bedingungen in R

Ich muss Spalten in meinem Datenframe entfernen, der über 4000 Spalten und 180 Zeilen enthält. Die Bedingungen, unter denen ich die Spalte im Datenframe entfernen möchte, sind: (i) Entfernen Sie die Spalte, wenn weniger als zwei Werte / Einträge ...

4 die antwort

Wie berechnet man mit Pandas die prozentuale Veränderung gegenüber dem Anfangswert?

Ich habe einDataFrame und müssen prozentuale Veränderung im Vergleich zum Jahresanfang von Unternehmen berechnen. Gibt es eine Möglichkeit, @ zu verwendepct_change() oder eine andere Methode, um diese Aufgabe auszuführen? Vielen Dank df sieht ...

4 die antwort

Wie erstelle ich eine for-Schleife in R für diese eigentümliche Berechnung?

Ich kann mit dieser (anscheinend) einfachen Art von Operation nichts anfangen: Gegeben diese zwei verschiedenen Datenrahmendf(A) (nrow = 10, ncol = 3) unddf(B) (nrow = 3, ncol = 3) df(A) df(B) col1 col2 col3 col1 col2 col3 1 2 4 1 4 5 3 5 7 2 7 ...

22 die antwort

data.frame Zeilen zu einer Liste

Ich habe ein data.frame, das ich zeilenweise in eine Liste umwandeln möchte, dh jede Zeile würde ihren eigenen Listenelementen entsprechen. Mit anderen Worten, ich hätte gerne eine Liste, die so lang ist, wie der data.frame Zeilen enthält. isher ...

2 die antwort

Pandas DataFrame-Gruppe durch Überlappen von Intervallen variabler Länge

Ich versuche, einen DataFrame nach 2 Spalten zu gruppieren (siehe Beispiel unten). Für die erste Spalte möchte ich, dass jeder Wert zu einer Gruppe gehört. Für die zweite Spalte möchte ich Intervalle mit ungleicher Größe gruppieren. ein ...

4 die antwort

Separieren einer Spalte in R [duplizieren]

Diese Frage hat hier bereits eine Antwort: Split eine String-Spalte in mehrere Dummy-Variablen [/questions/15905806/split-a-string-column-into-several-dummy-variables] 6 answersIch habe einfache Daten wie unter den MovieLense ...