Suchergebnisse für Anfrage "dataframe"

4 die antwort

So ordnen Sie die Übereinstimmungsreihenfolge zwischen zwei Datenrahmen neu an

Ich bin seit letzter Nacht mit dieser Frage beschäftigt und konnte nicht herausfinden, wie es geht. Was ich tun möchte, ist, df1 Zeichenfolgen mit df2 Zeichenfolgen abzugleichen und die ähnlichen herauszubekommen was ich tue ist so # a ...

4 die antwort

So schließen Sie mehrere Spalten in Spark-Datenrahmen in Python aus

Ich habe festgestellt, dass PySpark eine Methode namens @ hadrop aber es scheint, dass es nur eine Spalte auf einmal fallen lassen kann. Irgendwelche Ideen, wie Sie mehrere Spalten gleichzeitig löschen können? df.drop(['col1','col2']) TypeError ...

2 die antwort

Python - Pandas - Datenframe in CSV schreiben

Ich versuche, eine 4-Tabellen-, 3-Spalten- und 50-Zeilen-Datenrahmendatei mit Pandas in eine CSV-Datei zu schreiben. Ich erhalte den folgenden FehlerAttributeError: 'dict' object has no attribute 'to_csv'. Ich glaube, ich schreibe die Syntax ...

TOP-Veröffentlichungen

2 die antwort

Filter Spark DataFrame für String enthält

Ich benutzeSpark 1.3.0 [http://spark.apache.org/releases/spark-release-1-3-0.html] undSpark Avro 1.0.0 [https://github.com/databricks/spark-avro/tree/c5612df9b1a9768689fec91655faa2a7073fd9fc#spark-sql-avro-library] . Ich arbeite vondas Beispiel ...

2 die antwort

R Entfernen von Zeilen in einem Datenrahmen basierend auf dem ersten Zeichen einer Spalte

Ich habe einen großen Datenrahmen und möchte bestimmte Zeilen daraus entfernen, basierend auf dem ersten Zeichen einer Spalte, die ein Buchstabe oder eine Zahl ist. Ein Beispiel meines Datenrahmens sieht wie folgt ...

4 die antwort

sum Werte von Spalten, die mit derselben Zeichenfolge in pandas dataframe @ beginn

Ich habe einen Datenrahmen mit ca. 100 Spalten, der wie folgt aussieht: Id Economics-1 English-107 English-2 History-3 Economics-zz Economics-2 \ 0 56 1 1 0 1 0 0 1 11 0 0 0 0 1 0 2 6 0 0 1 0 0 1 3 43 0 0 0 1 0 1 4 14 0 1 0 0 1 0 Histo ...

6 die antwort

Auswählen von Daten aus Pandas Datenrahmen basierend auf Kriterien, die in einem Diktat gespeichert sind

Ich habe einen Pandas-Datenrahmen, der eine große Anzahl von Variablen enthält. Dies kann vereinfacht werden als: tempDF = pd.DataFrame({ 'var1': [12,12,12,12,45,45,45,51,51,51], 'var2': ['a','a','b','b','b','b','b','c','c','d'], ...

6 die antwort

Wie finde ich heraus, welche Spalten einen NaN-Wert in Pandas Datenrahmen (Python) enthalten?

Gab einen Pandas-Datenrahmen mit (möglicherweise) hier und da verstreuten NaN-Werten: Frage Wie bestimme ich, welche Spalten NaN-Werte enthalten? Kann ich insbesondere eine Liste der Spaltennamen erhalten, die NaNs enthalten? Vielen Dan

2 die antwort

Wie filtere ich basierend auf dem Array-Wert in PySpark?

Mein Schema: |-- Canonical_URL: string (nullable = true) |-- Certifications: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- Certification_Authority: string (nullable = true) | | |-- End: string (nullable = true) | | ...

2 die antwort

R Generiere nicht wiederholende Paare im Datenrahmen

So ist der Zweck, jede ID mit der anderen ID zu vergleichen, indem Entfernungen genommen werden. Betrachten Sie den folgenden DatenrahmenDf ID AN AW a white green b black yellow c purple gray d white gray Zum Vergleichen benötige ich eine ...