Resultados de la búsqueda a petición "mapreduce"

1 la respuesta

Soporte para gzip en Spark

Para un proyecto de Big Data, estoy planeando usarchispa, que tiene algunas características interesantes, como cálculos en memoria para cargas de trabajo rep...

1 la respuesta

¿IPython.parallel no usa multinúcleo?

Estoy experimentando con

1 la respuesta

¿Cómo ordenar los datos en el mapa reducir hadoop?

1 la respuesta

¿Cómo encontrar el ID de trabajo de un trabajo de hadoop en código?

4 la respuesta

Ejecución de un trabajo utilizando hadoop streaming y mrjob: PipeMapRed.waitOutputThreads (): el subproceso falló con el código 1

3 la respuesta

Leyendo HDFS y archivos locales en Java

Quiero leer las rutas de los archivos independientemente de si son HDFS o locales. Actualmente, paso las rutas locales con el archivo de prefijo: // y las ru...

2 la respuesta

No se ha encontrado la clase de asignador.

A veces mi trabajo de MR se queja de que no se encuentra la clase MyMapper. Y eso tengo que dar job.setJarByClass (MyMapper.class); Para decirle que lo cargu...

3 la respuesta

Hadoop MapReduce clasifica la salida con la tecla

Abajo hay un programa de reducción de mapa que cuenta palabras de varios archivos de texto. Mi objetivo es tener el resultado en un orden descendente con res...

1 la respuesta

Configuración de Spark: SPARK_MEM vs. SPARK_WORKER_MEMORY

En spark-env.sh, es posible configurar las siguientes variables de entorno:

1 la respuesta

¿Cuál es la razón para tener clases de contenedor de escritura en Hadoop MapReduce para tipos de Java?

Me parece que un