Resultados de la búsqueda a petición "mapreduce"

2 la respuesta

Chispa en problemas de carga de tarros

Estoy tratando de ejecutar un programa simple Map / Reduce java usando spark over yarn (Cloudera Hadoop 5.2 en CentOS). He intentado esto de 2 maneras diferentes. La primera forma es la ...

1 la respuesta

¿Diferencia entre Application Manager y Application Master en YARN?

Comprendí cómo funciona MRv1. Ahora estoy tratando de entender MRv2 ... ¿cuál es la diferencia entre Application Manager y Application Master en YARN?

3 la respuesta

Seleccione un recuento distinto cloudant / couchdb

Estoy comenzando un proyecto usando Cloudant. Es un sistema simple para iniciar sesión, por lo que puedo rastrear el uso de mis aplicaciones. Mis documentos se ven así: { aplicación: 'nombre de la aplicación', tipo: 'vista de página | iniciar ...

1 la respuesta

Encontrar el mayor valor para la clave

Quiero descubrir el país más grande con mayor área. mi conjunto de datos es el siguiente Afghanistan 648 Albania 29 Algeria 2388 Andorra 0 Austria 84 Bahrain 1 Bangladesh 143 Belgium 31 Benin 113 Bhutan 47 Brunei 6 Bulgaria 111 Burma ...

1 la respuesta

Excepción en el subproceso "main" org.apache.hadoop.ipc.RemoteException: el servidor IPC versión 9 no puede comunicarse con el cliente versión 4. ¿Cómo resolver esto?

Estoy usando hadoop 2.7.0 y java oracle jdk1.7.0_79 con NetBeans IDE 8.0.2. Cuando intento comunicarme con Hadoop usando el archivo Java, aparece el siguiente error. ¿Hay algún problema de dependencia involucrado? ¿O cómo puedo resolver este ...

1 la respuesta

Error de Mapreduce: no se pudo configurar el directorio local

Estoy ejecutando mapreduce wordcount example en hadoop instalado en Windows 8. Obtuve el error de la siguiente manera. Suena como un problema de permiso de seguridad. Pero no estoy muy seguro. Agregué una propiedad al archivo yarn-site.xml ...

1 la respuesta

Eliminar duplicados de MongoDB

hola tengo unos ~ 5 millones de documentos en mongodb (replicación) cada documento 43 campos. Cómo eliminar el documento duplicado. lo intenté db.testkdd.ensureIndex({ duration : 1 , protocol_type : 1 , service : 1 , flag : 1 , src_bytes : 1 , ...

2 la respuesta

Apache hive MSCK REPAIR TABLE nueva partición no agregada

Soy nuevo en Apache Hive. Mientras trabajo en una partición de tabla externa, si agrego una nueva partición directamente a HDFS, la nueva partición no se agrega después de ejecutar la tabla MSCK REPAIR. Debajo están los códigos que probé, - ...

2 la respuesta

¿Es posible restringir que un trabajo de MapReduce acceda a datos remotos?

Tenemos un algoritmo particular que queremos integrar con HDFS. El algoritmo requiere que accedamos a los datos localmente (el trabajo se realizaría exclusivamente en elMapper) Sin embargo, queremos aprovechar HDFS en términos de distribución del ...

9 la respuesta

¿Apache spark puede funcionar sin hadoop?

¿Hay alguna dependencia entreChispa - chispearyHadoop? Si no, ¿hay alguna característica que extrañaré cuando corro?Chispa - chispear sinHadoop?