Suchergebnisse für Anfrage "hadoop"

2 die antwort

NameNode HA bei Verwendung von hdfs: // URI

Mit HDFS- oder HFTP-URI-Schema (z. B.hdfs://namenode/path/to/file) Ich kann auf HDFS-Cluster zugreifen, ohne deren XML-Konfigurationsdateien zu benötigen. Es ist sehr praktisch, wenn Shell-Befehle wie @ ausgeführt werdehdfs dfs -get, hadoop ...

6 die antwort

Change Blockgröße bestehender Dateien in Hadoop

Betrachten Sie einen Hadoop-Cluster mit einer Standardblockgröße von 64 MB inhdfs-site.xml. Später beschließt das Team jedoch, dies auf 128 MB zu ändern. Hier sind meine Fragen für das obige Szenario? Ist für diese Änderung ein Neustart des ...

2 die antwort

java.lang.OutOfMemoryError: Java-Heapspeicher mit Hive

Ich habe Hadoop Hive 0.9.0 und 1.1.2 und NetBeans verwendet, aber ich habe diesen Fehler erhalten und kann dieses Problem nicht lösen. Bitte helfen Sie mir beim Code: public class Hive_test { private static String driverName ...

TOP-Veröffentlichungen

8 die antwort

Wie installiere ich RHadoop-Pakete (Rmr, Rhdfs, Rhbase)?

Eigentlich versuche ich mein Bestes, um mich in R zu integrieren, aber ich habe diesen Fehler bekommen. packages 'rmr', 'rJava', 'RJSONIO', 'rhdfs', 'rhbase', 'plyrmr' sind nicht verfügbar (für R Version 3.1.3) Schritte zur Integration von ...

4 die antwort

Warum gibt es eine mapreduce.jobtracker.address-Konfiguration auf YARN?

YARN ist die zweite Generation von Hadoop, die den Jobtracker-Daemon nicht mehr verwendet und durch den Ressourcenmanager ersetzt. Aber warum gibt es auf mapred-site.xml hadoop 2 eine mapreduce.jobtracker.address-Eigenschaft?

4 die antwort

Apache Drill vs Spark

Ich habe Erfahrung mit Apache Spark und Spark-SQL. Kürzlich habe ich ein Apache Drill Projekt gefunden. Könnten Sie mich beschreiben, was sind die wichtigsten Vorteile / Unterschiede zwischen ihnen? Ich habe schon gelesenFast Hadoop Analytics ...

2 die antwort

Python Hadoop-Streaming-Fehler "ERROR streaming.StreamJob: Job nicht erfolgreich!" Und Stack-Trace: ExitCodeException exitCode = 134

Ich versuche, ein Python-Skript auf einem Hadoop-Cluster mithilfe von Hadoop Streaming für die Stimmungsanalyse auszuführen. Dasselbe Skript, das ich auf einem lokalen Computer ausführe, der ordnungsgemäß ausgeführt wird und eine Ausgabe ...

6 die antwort

Wie kann ein JSON-Array in Presto @ über einen Cross-Join nicht verbunden werde

Gegeben eine Tabelle, die eine Spalte von JSON wie folgt enthält: {"payload":[{"type":"b","value":"9"}, {"type":"a","value":"8"}]} {"payload":[{"type":"c","value":"7"}, {"type":"b","value":"3"}]}Wie kann ich eine Presto-Abfrage schreiben, um den ...

6 die antwort

0.20.2 API Hadoop Version mit Java 5

Ich habe ein Maven-Projekt gestartet, das versucht, den MapReduce-Algorithmus in Java 1.5.0_14 zu implementieren. Ich habe die 0.20.2 API Hadoop Version gewählt. In der pom.xml verwende ich also folgende Abhängigkeit: <Abhängigkeit> < ...

4 die antwort

Wie verhält sich die Option --total-executor-cores mit spark-submit?

Ich führe einen Spark-Cluster über C ++ - Code aus, der in Python eingebunden ist. Ich teste derzeit verschiedene Konfigurationen von Multithreading-Optionen (auf Python- oder Spark-Ebene). Ich verwende Spark mit eigenständigen Binärdateien ...