Suchergebnisse für Anfrage "dataframe"

8 die antwort

Dataframe Apply-Methode zum Zurückgeben mehrerer Elemente (Serien)

import pandas as pd Sagen wir, ich habe eindataframe wie so: df = pd.DataFrame({"a":range(4),"b":range(1,5)})es sieht aus wie das a b 0 0 1 1 1 2 2 2 3 3 3 4und eine Funktion, die X mit Y multipliziert: def XtimesY(x,y): return x*yWenn ich ...

4 die antwort

Wie kann man anhand von 2 Schlüsseln von einem Datenrahmen zum nächsten die beste Übereinstimmung finden?

Ich habe 2 Datenrahmen, mit denen ich arbeite. Man hat eine Reihe von Orten und Koordinaten (Längengrad, Breitengrad). Das andere ist ein Wetterdatensatz mit Daten von Wetterstationen auf der ganzen Welt und ihren jeweiligen Koordinaten. Ich ...

2 die antwort

Wie führe ich eine Switch-Anweisung mit Apache Spark Dataframes (Python) durch?

Ich versuche, eine Operation für meine Daten auszuführen, bei der ein bestimmter Wert einer Liste vordefinierter Werte zugeordnet wird, wenn er einem der Kriterien entspricht, oder ansonsten einem Fall-Through-Wert. Dies wäre das Äquivalent zu ...

TOP-Veröffentlichungen

2 die antwort

PySpark Konvertieren einer Spalte vom Typ "Map" in mehrere Spalten in einem Datenrahmen

EinganIch habe eine SpalteParameters vom Typmap des Formulars: >>> from pyspark.sql import SQLContext >>> sqlContext = SQLContext(sc) >>> d = [{'Parameters': {'foo': '1', 'bar': '2', 'baz': 'aaa'}}] >>> df = sqlContext.createDataFrame(d) >>> ...

4 die antwort

pandas Dataframe-Spalten auf Wörterbuchwerte abbilden

Ich habe ein one: many Wörterbuch. Ich möchte die Werte einer Pandas-Dataframe-Spalte den Schlüsseln (NICHT den Werten) des Wörterbuchs zuordnen. Hier ist mein ...

8 die antwort

Entfernen Sie die Enden von Zeichenfolgeneinträgen in der pandas DataFrame-Spalte

Ich habe ein Pandas Dataframe mit einer Spalte eine Liste von Dateien import pandas as pd df = pd.read_csv('fname.csv') df.head() filename A B C fn1.txt 2 4 5 fn2.txt 1 2 1 fn3.txt .... ....Ich möchte die Dateierweiterung löschen.txt von jedem ...

2 die antwort

Effizientes Suchen nach Gruppen in einer einzelnen R data.table

Ich habe eine große, breitedata.table (20 m Zeilen) mit einer Personen-ID, aber mit vielen Spalten (~ 150), die viele Nullwerte enthalten. Jede Spalte ist ein aufgezeichneter Zustand / Attribut, das ich für jede Person vortragen möchte. Jede ...

2 die antwort

So verwenden Sie groupby in Pandas zum Berechnen eines Prozentsatzes / Anteils an der Gesamtsumme basierend auf einem Kriterium in einer anderen Spalte

Ich versuche herauszufinden, wie man das @ benutgroupby Funktion in Pandas, um die Anteile der Werte pro Jahr mit einem vorgegebenen Ja / Nein-Kriterium zu ermitteln. Zum Beispiel habe ich einen Datenrahmen mit dem Namennames: Name Number Year ...

2 die antwort

Was ist der schnellste Weg, um eine große CSV-Datei in ein Notebook hochzuladen, um mit Python-Pandas zu arbeiten?

Ich versuche, eine CSV-Datei hochzuladen, die 250 MB groß ist. Grundsätzlich 4 Millionen Zeilen und 6 Spalten mit Zeitreihendaten (1 Minute). Die übliche Vorgehensweise ist: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df ...

2 die antwort

Wie konvertiere ich eine RDD [Zeile] zurück in einen DataFrame [duplizieren]

Diese Frage hat hier bereits eine Antwort: So konvertieren Sie ein rdd-Objekt in einen Datenrahmen in spark [/questions/29383578/how-to-convert-rdd-object-to-dataframe-in-spark] 10 Antworten Ich habe versucht, RDDs in DataFrames umzuwandeln und ...