Suchergebnisse für Anfrage "dataframe"

12 die antwort

Provide Schema beim Lesen der CSV-Datei als Datenframe

Ich versuche, eine CSV-Datei in einen Datenrahmen einzulesen. Ich weiß, wie das Schema meines Datenrahmens aussehen soll, da ich meine CSV-Datei kenne. Außerdem verwende ich das Spark-CSV-Paket, um die Datei zu lesen. Ich versuche, das Schema ...

2 die antwort

Wie werden mehrere Spalten in pandas DataFrame für ein "Intervall" abgeglichen?

Ich habe die folgenden Pandas DataFrame: import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1 .... 15 ...

2 die antwort

pandas reset_index nach groupby.value_counts ()

Ich versuche, eine Spalte zu gruppieren und die Anzahl der Werte für eine andere Spalte zu berechnen. import pandas as pd dftest = pd.DataFrame({'A':[1,1,1,1,1,1,1,1,1,2,2,2,2,2], 'Amt':[20,20,20,30,30,30,30,40, 40,10, 10, 40,40,40]}) ...

TOP-Veröffentlichungen

4 die antwort

Umwandeln Sie die Zeichenfolge 2.90K in 2900 oder 5.2M in 5200000 in pandas dataframe

Benötigen Sie Hilfe bei der Verarbeitung von Daten in einem Pandas-Datenframe. Jede Hilfe ist herzlich willkommen. Ich habe OHCLV-Daten im CSV-Format. Ich habe die Datei in pandas dataframe geladen. Wie konvertiere ich die Datenträgerspalte von ...

4 die antwort

kombinieren von zwei Datenrahmen unterschiedlicher Länge an bestimmten Orten

Ich habe zwei Datenrahmen, einen mit sieben Zeilen, den anderen mit zwei Zeilen. Hier sind die beiden Frames: content ChatPosition 1 This is a start line START 2 This is a middle line MIDDLE 3 This is a middle line MIDDLE 4 This is the last line ...

2 die antwort

Wie greife ich auf ein Element einer VectorUDT-Spalte in einem Spark-DataFrame zu?

Ich habe einen Datenrahmendf mit einerVectorUDT Spalte mit dem Namenfeatures. Wie erhalte ich ein Element der Spalte, beispielsweise das erste Element? Ich habe Folgendes versucht from pyspark.sql.functions import udf first_elem_udf = ...

4 die antwort

R - Datenspalte aus String abrufen [duplizieren]

Diese Frage hat hier bereits eine Antwort: Dynamisches Auswählen von Datenrahmenspalten mit $ und einem Vektor mit Spaltennamen [/questions/18222286/dynamically-select-data-frame-columns-using-and-a-vector-of-column-names] 8 answers Ich ...

8 die antwort

Gruppierung von R-Datenrahmen nach verbundenen Werten

Ich habe in R keine Lösung für dieses häufige Gruppierungsproblem gefunden: Dies ist mein ursprünglicher Datensatz ID State 1 A 2 A 3 B 4 B 5 B 6 A 7 A 8 A 9 C 10 C Dies sollte mein gruppierter resultierender Datensatz sein State min(ID) ...

4 die antwort

Speichern Sie die Pandas-Spalte (Zeichenfolge / Objekt) als VARCHAR in der Oracle-Datenbank anstelle von CLOB (Standardverhalten)

Ich versuche, einen Datenrahmen in die Oracle-Datenbank zu übertragen, aber die Übertragung dauert zu lange, da der Datentyp der Variablen als @ angezeigt wir clob im Orakel. Ich glaube jedoch, wenn ich den Datentyp von @ konvertier clob zu ...

8 die antwort

Effiziente Python Pandas Stock Beta-Berechnung für viele Datenrahmen

Ich habe viele (4000+) CSVs von Bestandsdaten (Datum, Offen, Hoch, Niedrig, Schließen), die ich in einzelne Pandas-Datenrahmen importiere, um eine Analyse durchzuführen. Ich bin neu in Python und möchte für jede Aktie ein ...