Filtern eines Pyspark DataFrame mit einer SQL-ähnlichen IN-Klausel

Question

Mar 08, 2016, 04:00 PM

dataframe python sql pyspark apache-spark

Filtern eines Pyspark DataFrame mit einer SQL-ähnlichen IN-Klausel

Ich möchte einen Pyspark DataFrame mit einem SQL-ähnlichen @ filterIN -Klausel, wie in

sc = SparkContext()
sqlc = SQLContext(sc)
df = sqlc.sql('SELECT * from my_df WHERE field1 IN a')

woa ist das Tupel(1, 2, 3). Ich erhalte folgenden Fehler:

java.lang.RuntimeException: [1.67] Fehler: `` ('' erwartet, identifiziert aber ein gefundenes

which sagt im Grunde, es erwartete so etwas wie '(1, 2, 3)' anstelle einer. Das Problem ist, dass ich die Werte in a nicht manuell schreiben kann, da sie aus einem anderen Job extrahiert wurden.

Wie würde ich in diesem Fall filtern?

Antworten auf die Frage(8)

Top Fragen

0 die antwort

Wie man den RGB-Wert für den Chroma-Key-Effekt genau filtert

0 die antwort

Verstrichene Anzeigedauer

0 die antwort

SQL Server-Indizes enthalten Primärschlüssel?

0 die antwort

So unterscheiden Sie zwischen Null- und nicht bereitgestellten Werten für Teilaktualisierungen in Spring Rest Controller

0 die antwort

C ++ Operator Ambiguity

Du bist sehr aktiv! Es ist großartig!

Filtern eines Pyspark DataFrame mit einer SQL-ähnlichen IN-Klausel

Antworten auf die Frage(8)

Ihre Antwort auf die Frage

Top Fragen