Suchergebnisse für Anfrage "dataframe"
So ordnen Sie die Übereinstimmungsreihenfolge zwischen zwei Datenrahmen neu an
Ich bin seit letzter Nacht mit dieser Frage beschäftigt und konnte nicht herausfinden, wie es geht. Was ich tun möchte, ist, df1 Zeichenfolgen mit df2 Zeichenfolgen abzugleichen und die ähnlichen herauszubekommen was ich tue ist so # a ...
So schließen Sie mehrere Spalten in Spark-Datenrahmen in Python aus
Ich habe festgestellt, dass PySpark eine Methode namens @ hadrop aber es scheint, dass es nur eine Spalte auf einmal fallen lassen kann. Irgendwelche Ideen, wie Sie mehrere Spalten gleichzeitig löschen können? df.drop(['col1','col2']) TypeError ...
Python - Pandas - Datenframe in CSV schreiben
Ich versuche, eine 4-Tabellen-, 3-Spalten- und 50-Zeilen-Datenrahmendatei mit Pandas in eine CSV-Datei zu schreiben. Ich erhalte den folgenden FehlerAttributeError: 'dict' object has no attribute 'to_csv'. Ich glaube, ich schreibe die Syntax ...
Filter Spark DataFrame für String enthält
Ich benutzeSpark 1.3.0 [http://spark.apache.org/releases/spark-release-1-3-0.html] undSpark Avro 1.0.0 [https://github.com/databricks/spark-avro/tree/c5612df9b1a9768689fec91655faa2a7073fd9fc#spark-sql-avro-library] . Ich arbeite vondas Beispiel ...
R Entfernen von Zeilen in einem Datenrahmen basierend auf dem ersten Zeichen einer Spalte
Ich habe einen großen Datenrahmen und möchte bestimmte Zeilen daraus entfernen, basierend auf dem ersten Zeichen einer Spalte, die ein Buchstabe oder eine Zahl ist. Ein Beispiel meines Datenrahmens sieht wie folgt ...
sum Werte von Spalten, die mit derselben Zeichenfolge in pandas dataframe @ beginn
Ich habe einen Datenrahmen mit ca. 100 Spalten, der wie folgt aussieht: Id Economics-1 English-107 English-2 History-3 Economics-zz Economics-2 \ 0 56 1 1 0 1 0 0 1 11 0 0 0 0 1 0 2 6 0 0 1 0 0 1 3 43 0 0 0 1 0 1 4 14 0 1 0 0 1 0 Histo ...
Auswählen von Daten aus Pandas Datenrahmen basierend auf Kriterien, die in einem Diktat gespeichert sind
Ich habe einen Pandas-Datenrahmen, der eine große Anzahl von Variablen enthält. Dies kann vereinfacht werden als: tempDF = pd.DataFrame({ 'var1': [12,12,12,12,45,45,45,51,51,51], 'var2': ['a','a','b','b','b','b','b','c','c','d'], ...
Wie finde ich heraus, welche Spalten einen NaN-Wert in Pandas Datenrahmen (Python) enthalten?
Gab einen Pandas-Datenrahmen mit (möglicherweise) hier und da verstreuten NaN-Werten: Frage Wie bestimme ich, welche Spalten NaN-Werte enthalten? Kann ich insbesondere eine Liste der Spaltennamen erhalten, die NaNs enthalten? Vielen Dan
Wie filtere ich basierend auf dem Array-Wert in PySpark?
Mein Schema: |-- Canonical_URL: string (nullable = true) |-- Certifications: array (nullable = true) | |-- element: struct (containsNull = true) | | |-- Certification_Authority: string (nullable = true) | | |-- End: string (nullable = true) | | ...
R Generiere nicht wiederholende Paare im Datenrahmen
So ist der Zweck, jede ID mit der anderen ID zu vergleichen, indem Entfernungen genommen werden. Betrachten Sie den folgenden DatenrahmenDf ID AN AW a white green b black yellow c purple gray d white gray Zum Vergleichen benötige ich eine ...