Suchergebnisse für Anfrage "dataframe"

6 die antwort

Wie vergleiche ich zwei Datenrahmen / Tabellen und extrahiere Daten in R?

Beim Versuch, Fehlanpassungen zwischen den beiden folgenden Datenrahmen zu extrahieren, ist es mir bereits gelungen, einen neuen Datenrahmen zu erstellen, in dem Fehlanpassungen ersetzt werden. Was ich jetzt brauche, ist eine Liste von ...

6 die antwort

Wie man die `Unbenannt:` Spalte in einem Pandas-Datenrahmen loswird

Ich habe eine Situation, in der manchmal, wenn ich ein @ lecsv vondf Ich erhalte eine unerwünschte indexähnliche Spalte mit dem Namenunnamed:0. Das ist sehr nervig! Ich habe versuch merge.to_csv('xy.df', mode = 'w', inplace=False) was ich dachte ...

2 die antwort

Summenoperation auf PySpark DataFrame, die TypeError ausgibt, wenn der Typ in Ordnung ist

Ich habe einen solchen DataFrame in PySpark (dies ist das Ergebnis einer Einstellung (3), der DataFrame ist sehr groß): sc = SparkContext() df = [Row(owner=u'u1', a_d=0.1), Row(owner=u'u2', a_d=0.0), Row(owner=u'u1', a_d=0.3)]das GleicheInhabe ...

TOP-Veröffentlichungen

2 die antwort

So teilen Sie zwei Spalten in einem Datenrahmen auf

Also, in meinem Datenrahmen habe ich 2 Spalten. Und ich möchte diese 2 Spalten (a & b), Wert für Wert, teilen und zeigen. import pandas as pd csv1=pd.read_csv('auto$0$0.csv') csv2=pd.read_csv('auto$0$8.csv') df1 = pd.DataFrame(csv1, columns = ...

4 die antwort

Copy pandas dataframe mit openpyxl @ zu übertreff

Ich habe einige komplizierte Formatierungen in einer Vorlagendatei gespeichert, in der ich Daten von einem Pandas-Datenrahmen speichern muss. Problem ist, wenn ich pd.to_excel verwende, um in diesem Arbeitsblatt zu speichern, Pandas überschreibt ...

2 die antwort

Pandas: Top N Zeilen, Top N Zeilen pro Gruppe, entsprechend ROW_NUMBER OVER (PARTITION BY… ORDER BY…)

Was ist die Python-Entsprechung zur TOP-Funktion in T-SQL? Ich möchte meinen Datenrahmen in die obersten 50-KB-Zeilen filtern. Ich habe online gesucht und kann kein einfaches Beispiel finden.

4 die antwort

Pandas Dataframe Datetime Slicing mit Index vs MultiIndex

Mit einem einzelnen indizierten Datenrahmen kann ich Folgendes tun: df2 = DataFrame(data={'data': [1,2,3]}, index=Index([dt(2016,1,1), dt(2016,1,2), dt(2016,2,1)])) >>> df2['2016-01 : '2016-01'] data 2016-01-01 1 2016-01-02 2 ...

2 die antwort

Group DataFrame in 5-Minuten-Intervallen

Wie bekomme ich mit Python / Pandas nur die 5-Minuten-Daten aus dieser CSV? Für jedes 5-Minuten-Intervall versuche ich, DATUM, ZEIT, ÖFFNEN, HOCH, NIEDRIG, SCHLIESSEN und LAUTSTÄRKE für dieses 5-Minuten-Intervall zu ermitteln. DATE TIME OPEN ...

4 die antwort

spark: So erstellen Sie ein dropDuplicate für einen Datenframe unter Beibehaltung der Zeile mit dem höchsten Zeitstempel [duplizieren]

Diese Frage hat hier bereits eine Antwort: Maximale Zeile pro Gruppe in Spark DataFrame finden [/questions/35218882/find-maximum-row-per-group-in-spark-dataframe] 2 Antworten Ich habe einen Anwendungsfall, in dem ich doppelte Zeilen eines ...

6 die antwort

extract Spaltenwert basierend auf einem anderen Spaltenpandas-Datenrahmen

Ich bin irgendwie festgefahren, wenn ich den Wert einer Variablen extrahiere, die auf eine andere Variable konditioniert. Zum Beispiel der folgende Datenrahmen: A B p1 1 p1 2 p3 3 p2 4Wie kann ich den Wert von @ erhalteA wannB=3? Jedes Mal, wenn ...