Resultados de la búsqueda a petición "hdfs"
Hadoop: Proceso de ejemplo para generar un SequenceFile con binarios de imágenes para procesar en map / reduce
SiguiendoHadoop: ¿cómo acceder a (muchas) imágenes de fotos para ser procesadas por mapa / reducir? [https://stackoverflow.com/questions/8752772/hadoop-how-to-access-many-photo-images-to-be-processed-by-map-reduce] pregunta, donde ...
solo se pudo replicar en 0 nodos en lugar de minReplication (= 1). Hay 4 datanode (s) en ejecución y no se excluyen ningún nodo (s) en esta operación
No sé cómo solucionar este error: Vertex failed, vertexName=initialmap, vertexId=vertex_1449805139484_0001_1_00, diagnostics=[Task failed, ...
dfs.namenode.servicerpc-address o dfs.namenode.rpc-address no está configurado
Estaba intentando configurar hadoop con un nodo de nombre y cuatro nodos de datos. Pude configurar con éxito el nodo de nombre y el rastreador de trabajos en...
Hadoop dfs replicate
Lo siento chicos, solo una pregunta simple pero no puedo encontrar la pregunta exacta en google. La pregunta acerca de lo que significa dfs.replication? Si h...
El sumidero HDFS de Flume mantiene archivos pequeños
Estoy tratando de transmitir datos de Twitter a hdfs usando flume y esto: https://github.com/cloudera/cdh-twitter-example/ [https://github.com/cloudera/cdh-twitter-example/] Lo que sea que intente aquí, sigue creando archivos en HDFS que varían ...
Acceso remoto a HDFS en Kubernetes
Estoy tratando de configurar HDFS en minikube (por ahora) y más tarde en un clúster de Kubernetes DEV para poder usarlo con Spark. Quiero que Spark se ejecute localmente en mi máquina para poder ejecutarlo en modo de depuración durante el ...
Encontrar el número total de líneas en el archivo distribuido hdfs usando la línea de comando
Estoy trabajando en un clúster donde se guarda un conjunto de datoshdfs de manera distribuida Esto es lo que tengo: [hmi@bdadev-5 ~]$ hadoop fs -ls /bdatest/clm/data/ Found 1840 items -rw-r--r-- 3 bda supergroup 0 2015-08-11 00:32 ...
Hadoop: ... se replicará a 0 nodos en lugar de minReplication (= 1). Hay 1 datanode (s) en ejecución y no se excluyen ningún nodo (s) en esta operación
Recibo el siguiente error cuando intento escribir en HDFS como parte de mi aplicación multiproceso could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running and no node(s) are excluded in this ...