Resultados de la búsqueda a petición "hadoop"

1 la respuesta

solo se pudo replicar en 0 nodos en lugar de minReplication (= 1). Hay 4 datanode (s) en ejecución y no se excluyen ningún nodo (s) en esta operación

No sé cómo solucionar este error: Vertex failed, vertexName=initialmap, vertexId=vertex_1449805139484_0001_1_00, diagnostics=[Task failed, ...

1 la respuesta

Oozie: ¿Lanzar Mapa-Reducir desde la acción Ojazie <java>?

Estoy tratando de ejecutar una tarea Map-Reduce en un flujo de trabajo de Oozie usando un<java> acción. O'Reilley'sApache Oozie (Islam and Srinivasan 2015) señala que: Si bien no se recomienda, la acción de Java se puede utilizar para ...

8 la respuesta

¿Qué es RDD en chispa?

La definición dice: RDD es una colección distribuida inmutable de objetos No entiendo muy bien qué significa. ¿Es como los datos (objetos particionados) almacenados en el disco duro? Si es así, ¿cómo es que los RDD pueden tener clases definidas ...

3 la respuesta

¿Cómo establecer el tamaño del bloque de datos en Hadoop? ¿Es ventajoso cambiarlo?

Si podemos cambiar el tamaño del bloque de datos en Hadoop, hágamelo saber cómo hacerlo. ¿Es ventajoso cambiar el tamaño del bloque? En caso afirmativo, avíseme ¿Por qué y cómo? Si no es así, ¿me avisas por qué y cómo?

1 la respuesta

Escritura de archivos Hadoop

Refiriéndose a la guía definitiva de Hadoop del libro de Tom White ... Mi pregunta (suponiendo que el factor de replicación 3 y los datos se escriben en el nodo D1, D2, D3) Si entiendo correctamente, si la escritura en la primera ubicación D1 ...

9 la respuesta

Causado por: ERROR XSDB6: es posible que otra instancia de Derby ya haya arrancado la base de datos

Estoy tratando de ejecutar SparkSQL: val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)Pero el error que obtengo está a continuación: ... 125 more Caused by: java.sql.SQLException: Another instance of Derby may have already booted ...

1 la respuesta

No se puede conectar a HIVE2 a través de JAVA

[/imgs/FESNi.jpg]Refiriéndose aColmena2 [https://cwiki.apache.org/confluence/display/Hive/HiveServer2+Clients#HiveServer2Clients-JDBC] Creé un programa simple de Java para conectarse al servidor HIVE2 (no local) y agregué todos los archivos jar ...

1 la respuesta

Trabajo SparkR 100 minutos de tiempo de espera

He escrito un script sparkR un poco complejo y lo ejecuto usando spark-submit. Lo que básicamente hace el script es leer una gran tabla basada en parqué colmena / impala fila por fila y generar un nuevo archivo de parquet que tenga el mismo ...

5 la respuesta

¿Cómo descomprimir archivos .gz en un nuevo directorio en hadoop?

Tengo un montón de archivos .gz en una carpeta en hdfs. Quiero descomprimir todos estos archivos .gz en una nueva carpeta en hdfs. Cómo debería hacer esto?

2 la respuesta

Obtenga el último archivo actualizado en HDFS

Quiero el último archivo actualizado de uno de mis directorios HDFS. Básicamente, el código debe recorrer los directorios y subdirectorios y obtener la última ruta de archivo con el nombre del archivo. Pude obtener el último archivo en el sistema ...