Suchergebnisse für Anfrage "hadoop"

Ich möchte nach dem Hadoop-Partitionierer fragen. Ist er in Mappers implementiert? So messen Sie die Leistung der Verwendung des standardmäßigen Hash-Partitionierers: Gibt es einen besseren Partitionierer, um den Datenversatz zu ...

nosql hive hbase bigdata

2 die antwort

Was ist der Unterschied zwischen hbase und hive? (Hadoop)

ach meinem Verständnis ist Hbase die Hadoop-Datenbank und Hive das Data Warehous it @Hive können Tabellen erstellt und darin Daten gespeichert werden. Sie können auch Ihre vorhandenen HBase-Tabellen Hive zuordnen und auf diese zugreifen. Warum ...

scala apache-spark

4 die antwort

Dateien rekursiv aus Unterverzeichnissen mit Funken aus s3 oder lokalem Dateisystem lesen

Ich versuche, Dateien aus einem Verzeichnis zu lesen, das viele Unterverzeichnisse enthält. Die Daten sind in S3 und ich versuche dies zu tun: val rdd ...

TOP-Veröffentlichungen

The In-Depth Guide on Video Streaming Protocols [for non-tech founders]

Wie erstellt man eine Krypto-Tauschbörse?

apache-spark google-hadoop google-cloud-dataproc google-cloud-storage

6 die antwort

„Kein Dateisystem für Schema: gs“, wenn Spark-Job lokal ausgeführt wird

Ich führe einen Spark-Job aus (Version 1.2.0) und die Eingabe ist ein Ordner in einem Google Clous-Speicher-Bucket (d. H. Gs: // mybucket / folder). Wenn der Auftrag lokal auf meinem Mac ausgeführt wird, wird die folgende Fehlermeldung ...

yarn mapreduce

2 die antwort

Hadoop 2.6.0: Grundfehler beim Starten von MRAppMaster nach der Installation von

Ich habe gerade angefangen, mit Hadoop 2 zu arbeiten. Nach der Installation mit grundlegenden Konfigurationen habe ich immer keine Beispiele ausgeführt. Hat jemand dieses Problem gesehen und bitte helfen Sie mir? Und der Fehler ist so etwas ...

2 die antwort

Zu viele Falkner holen

Ich habe ein Setup, 2 Knoten Hadoop Cluster auf Ubuntu 12.04 und Hadoop 1.2.1. Während ich versuche Hadoop Word Count zu starten, bekomme ich "Too many fetch faliure error ". Ich habe viele Artikel referenziert, kann aber nicht herausfinden, wie ...

apache-spark yarn alluxio

2 die antwort

Ressourcen / Dokumentation zur Funktionsweise des Failovers für den Spark-Treiber (und dessen YARN-Container) im Garn-Cluster-Modus

Ich versuche zu verstehen, ob der Spark-Treiber eine einzelne Fehlerquelle darstellt, wenn er im Cluster-Modus für Yarn bereitgestellt wird. Daher möchte ich die Innereien des Failover-Prozesses in Bezug auf den YARN-Container des Spark-Treibers ...

hadoop2 amazon-s3 yarn amazon-web-services

10 die antwort

Wie kann ich von einer lokalen Hadoop 2.6-Installation auf S3 / S3n zugreifen?

Ich versuche, einen Amazon EMR-Cluster auf meinem lokalen Computer zu reproduzieren. Zu diesem Zweck habe ich das @ installie neueste stabile Version von Hadoop ab sofort - 2.6.0 [http://ftp.cixug.es/apache/hadoop/common/hadoop-2.6.0/]. Jetzt ...

bigdata scala apache-spark

4 die antwort

Wie kann ich mit Apache Spark den exakten Median berechnen?

DiesSeit [https://spark.apache.org/docs/0.7.0/api/core/spark/api/java/JavaDoubleRDD.html] enthält einige Statistikfunktionen (Mittelwert, stdev, Varianz usw.), aber keinen Median. Wie kann ich den exakten Median berechnen? Vielen Dan

hbase

6 die antwort

Wie kann ich vorab in hbase aufteilen

Ich speichere Daten in einer Datenbank mit 5 Regionsservern. Ich benutze MD5 Hash von URL als meine Zeilenschlüssel. Derzeit werden alle Daten nur auf einem Regionsserver gespeichert. Daher möchte ich die Regionen vorab aufteilen, damit die Daten ...

Seite 45 von 72

43 444546 47

Suchergebnisse für Anfrage "hadoop"

Hadoop partitioner

Was ist der Unterschied zwischen hbase und hive? (Hadoop)

Dateien rekursiv aus Unterverzeichnissen mit Funken aus s3 oder lokalem Dateisystem lesen

Beliebte Schlagwörter

TOP-Veröffentlichungen

„Kein Dateisystem für Schema: gs“, wenn Spark-Job lokal ausgeführt wird

Hadoop 2.6.0: Grundfehler beim Starten von MRAppMaster nach der Installation von

Zu viele Falkner holen

Ressourcen / Dokumentation zur Funktionsweise des Failovers für den Spark-Treiber (und dessen YARN-Container) im Garn-Cluster-Modus

Wie kann ich von einer lokalen Hadoop 2.6-Installation auf S3 / S3n zugreifen?

Wie kann ich mit Apache Spark den exakten Median berechnen?

Wie kann ich vorab in hbase aufteilen

Du bist sehr aktiv! Es ist großartig!

Suchergebnisse für Anfrage "hadoop"

Beliebte Schlagwörter

TOP-Veröffentlichungen