Suchergebnisse für Anfrage "hadoop"
NameNode HA bei Verwendung von hdfs: // URI
Mit HDFS- oder HFTP-URI-Schema (z. B.hdfs://namenode/path/to/file) Ich kann auf HDFS-Cluster zugreifen, ohne deren XML-Konfigurationsdateien zu benötigen. Es ist sehr praktisch, wenn Shell-Befehle wie @ ausgeführt werdehdfs dfs -get, hadoop ...
Change Blockgröße bestehender Dateien in Hadoop
Betrachten Sie einen Hadoop-Cluster mit einer Standardblockgröße von 64 MB inhdfs-site.xml. Später beschließt das Team jedoch, dies auf 128 MB zu ändern. Hier sind meine Fragen für das obige Szenario? Ist für diese Änderung ein Neustart des ...
java.lang.OutOfMemoryError: Java-Heapspeicher mit Hive
Ich habe Hadoop Hive 0.9.0 und 1.1.2 und NetBeans verwendet, aber ich habe diesen Fehler erhalten und kann dieses Problem nicht lösen. Bitte helfen Sie mir beim Code: public class Hive_test { private static String driverName ...
Wie installiere ich RHadoop-Pakete (Rmr, Rhdfs, Rhbase)?
Eigentlich versuche ich mein Bestes, um mich in R zu integrieren, aber ich habe diesen Fehler bekommen. packages 'rmr', 'rJava', 'RJSONIO', 'rhdfs', 'rhbase', 'plyrmr' sind nicht verfügbar (für R Version 3.1.3) Schritte zur Integration von ...
Warum gibt es eine mapreduce.jobtracker.address-Konfiguration auf YARN?
YARN ist die zweite Generation von Hadoop, die den Jobtracker-Daemon nicht mehr verwendet und durch den Ressourcenmanager ersetzt. Aber warum gibt es auf mapred-site.xml hadoop 2 eine mapreduce.jobtracker.address-Eigenschaft?
Apache Drill vs Spark
Ich habe Erfahrung mit Apache Spark und Spark-SQL. Kürzlich habe ich ein Apache Drill Projekt gefunden. Könnten Sie mich beschreiben, was sind die wichtigsten Vorteile / Unterschiede zwischen ihnen? Ich habe schon gelesenFast Hadoop Analytics ...
Python Hadoop-Streaming-Fehler "ERROR streaming.StreamJob: Job nicht erfolgreich!" Und Stack-Trace: ExitCodeException exitCode = 134
Ich versuche, ein Python-Skript auf einem Hadoop-Cluster mithilfe von Hadoop Streaming für die Stimmungsanalyse auszuführen. Dasselbe Skript, das ich auf einem lokalen Computer ausführe, der ordnungsgemäß ausgeführt wird und eine Ausgabe ...
Wie kann ein JSON-Array in Presto @ über einen Cross-Join nicht verbunden werde
Gegeben eine Tabelle, die eine Spalte von JSON wie folgt enthält: {"payload":[{"type":"b","value":"9"}, {"type":"a","value":"8"}]} {"payload":[{"type":"c","value":"7"}, {"type":"b","value":"3"}]}Wie kann ich eine Presto-Abfrage schreiben, um den ...
0.20.2 API Hadoop Version mit Java 5
Ich habe ein Maven-Projekt gestartet, das versucht, den MapReduce-Algorithmus in Java 1.5.0_14 zu implementieren. Ich habe die 0.20.2 API Hadoop Version gewählt. In der pom.xml verwende ich also folgende Abhängigkeit: <Abhängigkeit> < ...
Wie verhält sich die Option --total-executor-cores mit spark-submit?
Ich führe einen Spark-Cluster über C ++ - Code aus, der in Python eingebunden ist. Ich teste derzeit verschiedene Konfigurationen von Multithreading-Optionen (auf Python- oder Spark-Ebene). Ich verwende Spark mit eigenständigen Binärdateien ...