Suchergebnisse für Anfrage "dataframe"
Error - Ersetzung hat [x] Zeilen, Daten haben [y]
Ich habe eine numerische Spalte ("value") in einem Datenrahmen ("df"), und ich möchte eine neue Spalte ("valueBin") basierend auf "value" generieren. Ich habe den folgenden bedingten Code, um df $ valueBin zu ...
Mischen und Subtrahieren von DataFrame-Spalten in Pandas?
Ich habe einen Pandas DataFrame, so etwas wie: col1 col2 col3 col5 NaN 1 2 8 2 NaN 4 8 4 NaN 4 8 Ich möchte zwei Dinge tun: 1) Spalten 1 und 2 zusammenführen: newcol1 col3 col5 1 2 8 2 4 8 4 4 8 Ich habe versucht, .concat zu verwenden, aber ...
Pandas resample bis zum ersten Tag in meinen Daten
Ich habe einen täglichen Aktienkurs von Yahoo Finance in einen Pandas-Datenrahmen importiert. Ich möchte benutzen.resample(), um es in den monatlichen Aktienkurs umzuwandeln, indem der Preis des ersten QUOTED-Tageskurses eines jeden Monats ...
R: Pivoting mit 'Spread'-Funktion
Fortsetzen von meinem vorherigenPos [https://stackoverflow.com/questions/29773714/r-pivot-the-rows-into-columns-and-use-n-as-for-missing-values] , Ich habe jetzt 1 weitere Spalte mit ID-Werten, die ich zum Verschieben von Zeilen in Spalten ...
Die effizienteste Methode zum Lesen von Schlüsselwertpaaren, bei denen sich Werte über mehrere Zeilen erstrecken?
Was ist der schnellste Weg, um eine Textdatei wie das folgende Beispiel in eine zweispaltigedata.frame was wird dann in ein weites format umgewandelt? FN Thomson Reuters Web of Science™ VR 1.0 PT J AU Panseri, Sara Chiesa, Luca Maria Brizzolari, ...
Wie man einem Datenrahmen neue berechnete Variablen hinzufügt
Ich möchte eine Schleife erstellen, die jetzt Variablen zum Datenrahmen hinzufügt. Diese Variablen sollten die einfache quadratische Form der vorhandenen Variablen sein. Im folgenden Beispiel hätte ich gerne 3 neue Vars:dat$birds_2 <- ...
Python / Pandas: Zählen der Anzahl der fehlenden / NaN in jeder Zeile
Ich habe einen Datensatz mit einer großen Anzahl von Zeilen. Einige der Werte sind NaN wie folgt: In [91]: df Out[91]: 1 3 1 1 1 1 3 1 1 1 2 3 1 1 1 1 1 NaN NaN NaN 1 3 1 1 1 1 1 1 1 1Und ich möchte die Anzahl der NaN-Werte in jeder ...
Anzahl der Nicht-NaN-Einträge in jeder Spalte von Dataframe
Ich habe einen wirklich großen DataFrame und habe mich gefragt, ob es einen kurzen (ein oder zwei Zeilen) Weg gibt, um die Anzahl der Nicht-NaN-Einträge in einem DataFrame zu ermitteln. Ich möchte diese Spalte nicht einzeln ausführen, da ich ...
Finde Top Deciles von DataFrame nach Gruppe
Ich versuche, neue Variablen mit einer Funktion und @ zu erstellelapply anstatt direkt in den Daten mit Schleifen zu arbeiten. Früher habe ich Stata verwendet und dieses Problem mit einer Methode gelöst, die der von @ beschriebenen ...
Renaming-Spalten für Pyspark Dataframes-Aggregate
Ich analysiere einige Daten mit Pyspark-Datenrahmen. Angenommen, ich habe einen Datenrahmen.df dass ich aggregiere: df.groupBy("group")\ .agg({"money":"sum"})\ .show(100)Dies wird mir geben: group SUM(money#2L) A 137461285853 B 172185566943 C ...