Suchergebnisse für Anfrage "apache-spark-sql"

Ich versuche, eine linke äußere Verknüpfung in spark (1.6.2) zu erstellen, aber das funktioniert nicht. Meine SQL-Abfrage sieht folgendermaßen aus: sqlContext.sql("select t.type, t.uuid, p.uuid from symptom_type t LEFT JOIN plugin p ON t.uuid = ...

scala apache-spark hive

2 die antwort

Verwenden Sie mehr als eine collect_list in einer Abfrage in Spark SQL

Ich habe den folgenden Datenrahmendata: root |-- userId: string |-- product: string |-- rating: doubleund die folgende Abfrage: val result = sqlContext.sql("select userId, collect_list(product), collect_list(rating) from data group by ...

python apache-spark pyspark

2 die antwort

Wie man nach einem Join mehrere Spalten in einem Pyspark Dataframe auswählt und anordnet

Ich möchte mehrere Spalten aus einem vorhandenen Datenrahmen auswählen (der nach Verknüpfungen erstellt wird) und möchte die Dateien als meine Zieltabellenstruktur sortieren. Wie geht das? Der Ansatz, den ich verwendet habe, ist unten. Hier kann ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

apache-spark spark-csv spark-dataframe scala

2 die antwort

Scala: Spark SQL to_date (unix_timestamp) gibt NULL @ zurü

Spark Version: spark-2.0.1-bin-hadoop2.7 Scala: 2.11.8 Ich lade eine unformatierte CSV in einen DataFrame. In csv wird die Spalte zwar im Datumsformat unterstützt, sie wird jedoch als 20161025 anstatt als 2016-10-25 geschrieben. Der ...

java apache-spark

2 die antwort

Wie verwende ich Column.isin in Java?

Ich versuche, einen Spark-DataFrame mithilfe einer Liste in Java zu filtern. java.util.List<Long> selected = ....; DataFrame result = df.filter(df.col("something").isin(????));Das Problem ist, dassisin(...) Methode akzeptiert ScalaSeq oder ...

data-partitioning

4 die antwort

Spark SQL - Unterschied zwischen df.repartition und DataFrameWriter partitionBy?

Was ist der Unterschied zwischen DataFramerepartition() und DataFrameWriterpartitionBy() Methoden? Ich hoffe, beide werden verwendet, um "Daten basierend auf Datenrahmenspalte zu partitionieren"? Oder gibt es da einen Unterschied?

vitess apache-spark-2.0 apache-spark jdbc

4 die antwort

Wie wird SQL-Dialekt angegeben, wenn Spark-Datenrahmen aus JDBC erstellt werden?

Ich habe ein Problem beim Lesen von Daten über benutzerdefiniertes JDBC mit Spark. Wie würde ich vorgehen, um den über die JDBC-URL abgeleiteten SQL-Dialekt zu überschreiben? Die fragliche Datenbank ist vitess https: ...

csv apache-spark pyspark apache-spark-2.0

6 die antwort

Lesen von CSV-Dateien mit Feldern in Anführungszeichen, die eingebettete Kommas enthalten

Ich lese eine CSV-Datei in Pyspark wie folgt: df_raw=spark.read.option("header","true").csv(csv_path) Die Datendatei enthält jedoch Felder mit eingebetteten Kommas, die nicht als Kommas behandelt werden dürfen. Wie kann ich mit Pyspark umgehen? ...

apache-spark window-functions pyspark

4 die antwort

Pyspark: Benutzerdefinierte Fensterfunktion

Ich versuche derzeit, eine Reihe aufeinanderfolgender Vorkommen in einem PySpark-Datenrahmen zu extrahieren und sie wie unten gezeigt zu ordnen / einzuordnen (der Einfachheit halber habe ich den anfänglichen Datenrahmen nach @ bestelluser_id ...

Seite 32 von 32

28 29 30 3132

Suchergebnisse für Anfrage "apache-spark-sql"

Wie mache ich Left Outer Join in Spark SQL?

Verwenden Sie mehr als eine collect_list in einer Abfrage in Spark SQL

Wie man nach einem Join mehrere Spalten in einem Pyspark Dataframe auswählt und anordnet

Beliebte Schlagwörter

TOP-Veröffentlichungen

Scala: Spark SQL to_date (unix_timestamp) gibt NULL @ zurü

Wie verwende ich Column.isin in Java?

Spark SQL - Unterschied zwischen df.repartition und DataFrameWriter partitionBy?

Wie wird SQL-Dialekt angegeben, wenn Spark-Datenrahmen aus JDBC erstellt werden?

Lesen von CSV-Dateien mit Feldern in Anführungszeichen, die eingebettete Kommas enthalten

Pyspark: Benutzerdefinierte Fensterfunktion

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "apache-spark-sql"

Beliebte Schlagwörter

TOP-Veröffentlichungen