Suchergebnisse für Anfrage "dataframe"
Dataframe Apply-Methode zum Zurückgeben mehrerer Elemente (Serien)
import pandas as pd Sagen wir, ich habe eindataframe wie so: df = pd.DataFrame({"a":range(4),"b":range(1,5)})es sieht aus wie das a b 0 0 1 1 1 2 2 2 3 3 3 4und eine Funktion, die X mit Y multipliziert: def XtimesY(x,y): return x*yWenn ich ...
Wie kann man anhand von 2 Schlüsseln von einem Datenrahmen zum nächsten die beste Übereinstimmung finden?
Ich habe 2 Datenrahmen, mit denen ich arbeite. Man hat eine Reihe von Orten und Koordinaten (Längengrad, Breitengrad). Das andere ist ein Wetterdatensatz mit Daten von Wetterstationen auf der ganzen Welt und ihren jeweiligen Koordinaten. Ich ...
Wie führe ich eine Switch-Anweisung mit Apache Spark Dataframes (Python) durch?
Ich versuche, eine Operation für meine Daten auszuführen, bei der ein bestimmter Wert einer Liste vordefinierter Werte zugeordnet wird, wenn er einem der Kriterien entspricht, oder ansonsten einem Fall-Through-Wert. Dies wäre das Äquivalent zu ...
PySpark Konvertieren einer Spalte vom Typ "Map" in mehrere Spalten in einem Datenrahmen
EinganIch habe eine SpalteParameters vom Typmap des Formulars: >>> from pyspark.sql import SQLContext >>> sqlContext = SQLContext(sc) >>> d = [{'Parameters': {'foo': '1', 'bar': '2', 'baz': 'aaa'}}] >>> df = sqlContext.createDataFrame(d) >>> ...
pandas Dataframe-Spalten auf Wörterbuchwerte abbilden
Ich habe ein one: many Wörterbuch. Ich möchte die Werte einer Pandas-Dataframe-Spalte den Schlüsseln (NICHT den Werten) des Wörterbuchs zuordnen. Hier ist mein ...
Entfernen Sie die Enden von Zeichenfolgeneinträgen in der pandas DataFrame-Spalte
Ich habe ein Pandas Dataframe mit einer Spalte eine Liste von Dateien import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Ich möchte die Dateierweiterung löschen.txt von jedem ...
Effizientes Suchen nach Gruppen in einer einzelnen R data.table
Ich habe eine große, breitedata.table (20 m Zeilen) mit einer Personen-ID, aber mit vielen Spalten (~ 150), die viele Nullwerte enthalten. Jede Spalte ist ein aufgezeichneter Zustand / Attribut, das ich für jede Person vortragen möchte. Jede ...
So verwenden Sie groupby in Pandas zum Berechnen eines Prozentsatzes / Anteils an der Gesamtsumme basierend auf einem Kriterium in einer anderen Spalte
Ich versuche herauszufinden, wie man das @ benutgroupby Funktion in Pandas, um die Anteile der Werte pro Jahr mit einem vorgegebenen Ja / Nein-Kriterium zu ermitteln. Zum Beispiel habe ich einen Datenrahmen mit dem Namennames: Name Number Year ...
Was ist der schnellste Weg, um eine große CSV-Datei in ein Notebook hochzuladen, um mit Python-Pandas zu arbeiten?
Ich versuche, eine CSV-Datei hochzuladen, die 250 MB groß ist. Grundsätzlich 4 Millionen Zeilen und 6 Spalten mit Zeitreihendaten (1 Minute). Die übliche Vorgehensweise ist: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df ...
Wie konvertiere ich eine RDD [Zeile] zurück in einen DataFrame [duplizieren]
Diese Frage hat hier bereits eine Antwort: So konvertieren Sie ein rdd-Objekt in einen Datenrahmen in spark [/questions/29383578/how-to-convert-rdd-object-to-dataframe-in-spark] 10 Antworten Ich habe versucht, RDDs in DataFrames umzuwandeln und ...