Suchergebnisse für Anfrage "dataframe"
Wie vergleiche ich zwei Datenrahmen / Tabellen und extrahiere Daten in R?
Beim Versuch, Fehlanpassungen zwischen den beiden folgenden Datenrahmen zu extrahieren, ist es mir bereits gelungen, einen neuen Datenrahmen zu erstellen, in dem Fehlanpassungen ersetzt werden. Was ich jetzt brauche, ist eine Liste von ...
Wie man die `Unbenannt:` Spalte in einem Pandas-Datenrahmen loswird
Ich habe eine Situation, in der manchmal, wenn ich ein @ lecsv vondf Ich erhalte eine unerwünschte indexähnliche Spalte mit dem Namenunnamed:0. Das ist sehr nervig! Ich habe versuch merge.to_csv('xy.df', mode = 'w', inplace=False) was ich dachte ...
Summenoperation auf PySpark DataFrame, die TypeError ausgibt, wenn der Typ in Ordnung ist
Ich habe einen solchen DataFrame in PySpark (dies ist das Ergebnis einer Einstellung (3), der DataFrame ist sehr groß): sc = SparkContext() df = [Row(owner=u'u1', a_d=0.1), Row(owner=u'u2', a_d=0.0), Row(owner=u'u1', a_d=0.3)]das GleicheInhabe ...
So teilen Sie zwei Spalten in einem Datenrahmen auf
Also, in meinem Datenrahmen habe ich 2 Spalten. Und ich möchte diese 2 Spalten (a & b), Wert für Wert, teilen und zeigen. import pandas as pd csv1=pd.read_csv('auto$0$0.csv') csv2=pd.read_csv('auto$0$8.csv') df1 = pd.DataFrame(csv1, columns = ...
Copy pandas dataframe mit openpyxl @ zu übertreff
Ich habe einige komplizierte Formatierungen in einer Vorlagendatei gespeichert, in der ich Daten von einem Pandas-Datenrahmen speichern muss. Problem ist, wenn ich pd.to_excel verwende, um in diesem Arbeitsblatt zu speichern, Pandas überschreibt ...
Pandas: Top N Zeilen, Top N Zeilen pro Gruppe, entsprechend ROW_NUMBER OVER (PARTITION BY… ORDER BY…)
Was ist die Python-Entsprechung zur TOP-Funktion in T-SQL? Ich möchte meinen Datenrahmen in die obersten 50-KB-Zeilen filtern. Ich habe online gesucht und kann kein einfaches Beispiel finden.
Pandas Dataframe Datetime Slicing mit Index vs MultiIndex
Mit einem einzelnen indizierten Datenrahmen kann ich Folgendes tun: df2 = DataFrame(data={'data': [1,2,3]}, index=Index([dt(2016,1,1), dt(2016,1,2), dt(2016,2,1)])) >>> df2['2016-01 : '2016-01'] data 2016-01-01 1 2016-01-02 2 ...
Group DataFrame in 5-Minuten-Intervallen
Wie bekomme ich mit Python / Pandas nur die 5-Minuten-Daten aus dieser CSV? Für jedes 5-Minuten-Intervall versuche ich, DATUM, ZEIT, ÖFFNEN, HOCH, NIEDRIG, SCHLIESSEN und LAUTSTÄRKE für dieses 5-Minuten-Intervall zu ermitteln. DATE TIME OPEN ...
spark: So erstellen Sie ein dropDuplicate für einen Datenframe unter Beibehaltung der Zeile mit dem höchsten Zeitstempel [duplizieren]
Diese Frage hat hier bereits eine Antwort: Maximale Zeile pro Gruppe in Spark DataFrame finden [/questions/35218882/find-maximum-row-per-group-in-spark-dataframe] 2 Antworten Ich habe einen Anwendungsfall, in dem ich doppelte Zeilen eines ...
extract Spaltenwert basierend auf einem anderen Spaltenpandas-Datenrahmen
Ich bin irgendwie festgefahren, wenn ich den Wert einer Variablen extrahiere, die auf eine andere Variable konditioniert. Zum Beispiel der folgende Datenrahmen: A B p1 1 p1 2 p3 3 p2 4Wie kann ich den Wert von @ erhalteA wannB=3? Jedes Mal, wenn ...