Suchergebnisse für Anfrage "parquet"

Ich kann einige JSON-Dateien gleichzeitig mit * (Stern) lesen: sqlContext.jsonFile('/path/to/dir/*.json')ibt es eine Möglichkeit, dasselbe für Parkett zu tun? Star funktioniert nicht.

avro hadoop

14 die antwort

Avro vs. Parkett

Ich plane, für mein Hadoop-Projekt eines der Hadoop-Dateiformate zu verwenden. ICHverstehe Parkett ist effizient für spaltenbasierte Abfragen und Avro für den vollständigen Scan oder wenn wir alle Säulendaten benötigen! Bevor ich fortfahre und ...

cloudera-cdh hadoop impala

2 die antwort

Ist es möglich, Parkett direkt aus der Datei zu laden?

Wenn ich eine binäre Datendatei habe (diese kann in das CSV-Format konvertiert werden), gibt es eine Möglichkeit, Parketttabellen direkt daraus zu laden? In vielen Tutorials wird gezeigt, wie eine CSV-Datei in eine Texttabelle und anschließend ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

jets3t amazon-s3 apache-spark-sql apache-spark

2 die antwort

EntityTooLarge-Fehler beim Hochladen einer 5G-Datei auf Amazon S3

Amazon S3 Dateigrößenbeschränkung soll laut diesem @ 5T betragAnkündigun [http://aws.amazon.com/blogs/aws/amazon-s3-object-size-limit/], aber ich erhalte die folgende Fehlermeldung beim Hochladen einer ...

apache-spark-sql apache-spark amazon-s3 hadoop

1 die antwort

Spark SQL kann das Schreiben von Parkettdaten mit einer großen Anzahl von Shards nicht abschließen.

Ich versuche, Apache Spark SQL zu verwenden, um JSON-Protokolldaten in S3 auch in Parquet-Dateien in S3 zu speichern. Mein Code ist im Grunde: import org.apache.spark._ val sqlContext = sql.SQLContext(sc) val data ...

apache-spark sql

4 die antwort

Wie konvertiere ich spark SchemaRDD in RDD meiner Fallklasse?

In den Spark-Dokumenten ist es klar, wie Parkettdateien aus @ erstellt werdeRDD Ihrer eigenen Fallklassen; (aus den Dokumenten) val people: RDD[Person] = ??? // An RDD of case class objects, from the previous example. // The RDD is implicitly ...

Seite 3 von 3

1 23

Suchergebnisse für Anfrage "parquet"

Lesen Sie gleichzeitig einige Parkettdateien in Spark

Avro vs. Parkett

Ist es möglich, Parkett direkt aus der Datei zu laden?

Beliebte Schlagwörter

TOP-Veröffentlichungen

EntityTooLarge-Fehler beim Hochladen einer 5G-Datei auf Amazon S3

Spark SQL kann das Schreiben von Parkettdaten mit einer großen Anzahl von Shards nicht abschließen.

Wie konvertiere ich spark SchemaRDD in RDD meiner Fallklasse?

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "parquet"

Lesen Sie gleichzeitig einige Parkettdateien in Spark

Avro vs. Parkett

Ist es möglich, Parkett direkt aus der Datei zu laden?

Beliebte Schlagwörter

TOP-Veröffentlichungen

EntityTooLarge-Fehler beim Hochladen einer 5G-Datei auf Amazon S3

Spark SQL kann das Schreiben von Parkettdaten mit einer großen Anzahl von Shards nicht abschließen.

Wie konvertiere ich spark SchemaRDD in RDD meiner Fallklasse?