Suchergebnisse für Anfrage "dataframe"

4 die antwort

Error - Ersetzung hat [x] Zeilen, Daten haben [y]

Ich habe eine numerische Spalte ("value") in einem Datenrahmen ("df"), und ich möchte eine neue Spalte ("valueBin") basierend auf "value" generieren. Ich habe den folgenden bedingten Code, um df $ valueBin zu ...

6 die antwort

Mischen und Subtrahieren von DataFrame-Spalten in Pandas?

Ich habe einen Pandas DataFrame, so etwas wie: col1 col2 col3 col5 NaN 1 2 8 2 NaN 4 8 4 NaN 4 8 Ich möchte zwei Dinge tun: 1) Spalten 1 und 2 zusammenführen: newcol1 col3 col5 1 2 8 2 4 8 4 4 8 Ich habe versucht, .concat zu verwenden, aber ...

2 die antwort

Pandas resample bis zum ersten Tag in meinen Daten

Ich habe einen täglichen Aktienkurs von Yahoo Finance in einen Pandas-Datenrahmen importiert. Ich möchte benutzen.resample(), um es in den monatlichen Aktienkurs umzuwandeln, indem der Preis des ersten QUOTED-Tageskurses eines jeden Monats ...

TOP-Veröffentlichungen

2 die antwort

R: Pivoting mit 'Spread'-Funktion

Fortsetzen von meinem vorherigenPos [https://stackoverflow.com/questions/29773714/r-pivot-the-rows-into-columns-and-use-n-as-for-missing-values] , Ich habe jetzt 1 weitere Spalte mit ID-Werten, die ich zum Verschieben von Zeilen in Spalten ...

6 die antwort

Die effizienteste Methode zum Lesen von Schlüsselwertpaaren, bei denen sich Werte über mehrere Zeilen erstrecken?

Was ist der schnellste Weg, um eine Textdatei wie das folgende Beispiel in eine zweispaltigedata.frame was wird dann in ein weites format umgewandelt? FN Thomson Reuters Web of Science™ VR 1.0 PT J AU Panseri, Sara Chiesa, Luca Maria Brizzolari, ...

10 die antwort

Wie man einem Datenrahmen neue berechnete Variablen hinzufügt

Ich möchte eine Schleife erstellen, die jetzt Variablen zum Datenrahmen hinzufügt. Diese Variablen sollten die einfache quadratische Form der vorhandenen Variablen sein. Im folgenden Beispiel hätte ich gerne 3 neue Vars:dat$birds_2 <- ...

2 die antwort

Python / Pandas: Zählen der Anzahl der fehlenden / NaN in jeder Zeile

Ich habe einen Datensatz mit einer großen Anzahl von Zeilen. Einige der Werte sind NaN wie folgt: In [91]: df Out[91]: 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 1Und ich möchte die Anzahl der NaN-Werte in jeder ...

2 die antwort

Anzahl der Nicht-NaN-Einträge in jeder Spalte von Dataframe

Ich habe einen wirklich großen DataFrame und habe mich gefragt, ob es einen kurzen (ein oder zwei Zeilen) Weg gibt, um die Anzahl der Nicht-NaN-Einträge in einem DataFrame zu ermitteln. Ich möchte diese Spalte nicht einzeln ausführen, da ich ...

6 die antwort

Finde Top Deciles von DataFrame nach Gruppe

Ich versuche, neue Variablen mit einer Funktion und @ zu erstellelapply anstatt direkt in den Daten mit Schleifen zu arbeiten. Früher habe ich Stata verwendet und dieses Problem mit einer Methode gelöst, die der von @ beschriebenen ...

12 die antwort

Renaming-Spalten für Pyspark Dataframes-Aggregate

Ich analysiere einige Daten mit Pyspark-Datenrahmen. Angenommen, ich habe einen Datenrahmen.df dass ich aggregiere: df.groupBy("group")\ .agg({"money":"sum"})\ .show(100)Dies wird mir geben: group SUM(money#2L) A 137461285853 B 172185566943 C ...