Suchergebnisse für Anfrage "hadoop"
Was ist eine Sequenzdatei in Hadoop?
Ich bin neu bei Map-Reduce und möchte verstehen, was die Eingabe von Sequenzdatei-Daten ist. Ich habe im Hadoop-Buch studiert, aber es war schwer für mich zu verstehen.
Oozie: Map-Reduce von Oozie <java> aus starten?
Ich versuche, eine Map-Reduce-Aufgabe in einem Oozie-Workflow mit einem @ auszuführe<java> Aktion O'Reilley'sApache Oozie (Islam und Srinivasan 2015) stellt fest, dass: Während dies nicht empfohlen wird, können mit Java-Aktionen ...
Ursache: FEHLER XSDB6: Möglicherweise hat eine andere Derby-Instanz die Datenbank bereits gebootet
Ich versuche SparkSQL auszuführen: val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) Aber der Fehler, den ich bekomme, ist unten: ... 125 more Caused by: java.sql.SQLException: Another instance of Derby may have already booted the ...
Hadoop Datei schreiben
Verweis auf Tom Whites Buch Hadoop definitive guide ..... Meine Frage (unter der Annahme, dass der Replikationsfaktor 3 und die Daten auf den Knoten D1, D2, D3 geschrieben werden) Wenn ich es richtig verstehe, ist das Schreiben an den ersten ...
Was ist RDD im Funken
Definition sagt: RDD ist unveränderlich verteilte Sammlung von Objekten Ich verstehe nicht ganz was es bedeutet. Ist es wie Daten (partitionierte Objekte), die auf der Festplatte gespeichert sind? Wenn ja, wie kommt es, dass RDDs ...
Wie wird die Datenblockgröße in Hadoop eingestellt? Ist es von Vorteil, es zu ändern?
Wenn wir die Datenblockgröße in Hadoop ändern können, teilen Sie mir bitte mit, wie das geht. Ist es vorteilhaft, die Blockgröße zu ändern? Wenn ja, lassen Sie es mich wissen, warum und wie? Wenn nein, warum und wie?
Verbindung mit HIVE2 über JAVA nicht möglich
[/imgs/FESNi.jpg]In Bezug auf Hive2 [https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC] hat ein einfaches Java-Programm erstellt, um eine Verbindung zum HIVE2-Server herzustellen (nicht lokal). Alle ...
Lesen Sie die zuletzt aktualisierte Datei in HDFS
Ich möchte die neueste aktualisierte Datei aus einem meiner HDFS-Verzeichnisse. Der Code sollte im Grunde genommen die Verzeichnisse und Unterverzeichnisse durchlaufen und den neuesten Dateipfad mit dem Dateinamen abrufen. Ich konnte die neueste ...
Wie entpacke ich .gz-Dateien in ein neues Verzeichnis in hadoop?
Ich habe eine Reihe von .gz-Dateien in einem Ordner in hdfs. Ich möchte alle diese .gz-Dateien in einen neuen Ordner in hdfs entpacken. Wie soll ich das machen?
Spark 1.6-Fehler beim Auffinden der Winutils-Binärdatei im Hadoop-Binärpfad
Ich weiß, dass es einen sehr ähnlichen Beitrag zu diesem gibt Fehler beim Auffinden der Winutils-Binärdatei im Binärpfad von Hadoop [https://stackoverflow.com/questions/19620642/failed-to-locate-the-winutils-binary-in-the-hadoop-binary-path] ) ...