Resultados de la búsqueda a petición "hadoop"

6 la respuesta

Transferencias lentas en Jetty con codificación de transferencia fragmentada en cierto tamaño de búfer

Estoy investigando un problema de rendimiento con Jetty 6.1.26. Jetty parece usarTransfer-Encoding: chunked, y dependiendo del tamaño del búfer utilizado, esto puede ser muy lento cuando se transfiere localmente. He creado una pequeña ...

16 la respuesta

Hadoop performance

I instalé hadoop 1.0.0 y probé el ejemplo de conteo de palabras (clúster de nodo único). Tardaron 2m 48 segundos en completarse. Luego probé el programa estándar de conteo de palabras de Linux, que se ejecuta en 10 milisegundos en el ...

6 la respuesta

Hadoop Job: la tarea no puede informar el estado durante 601 segundos

Mientras se ejecuta el trabajo de hadoop en pseudonodo, la tarea falla y fue asesinada. Error: la tarea intento_ no puede informar el estado durante 601 segundos Pero el mismo programa se ejecuta a través de Eclipse (trabajo local). Task: hay ...

18 la respuesta

JAVA_HOME no configura

Mientras trabajaba en Hadoopmplementación de @ en operación pseudo-distribuida, encontré la siguiente excepción de JAVA_HOME variable no configurada, pero cuando traté de repetirla, se configuró. Variable está preestablecido enconf/hadoop-env.sh ...

10 la respuesta

¿Cómo usar Sqoop en el programa Java?

Sé cómo usar sqoop a través de la línea de comandos. Pero no sé cómo llamar al comando sqoop usando programas java. ¿Alguien puede dar alguna vista de código?

12 la respuesta

Escribiendo el código MApreduce para contar el número de registros

Quiero escribir un código de reducción de mapas para contar el número de registros en un archivo CSV dado. No entiendo qué hacer en el mapa y qué hacer para reducir, ¿cómo debo resolver esto? ¿Alguien puede sugerir algo?

4 la respuesta

¿Cómo especificar configuraciones mapeadas y opciones de Java con jar personalizado en CLI usando EMR de Amazon?

Me gustaría saber cómo especificar configuraciones de mapreduce como mapred.task.timeout, mapred.min.split.size etc., cuando se ejecuta un trabajo de transmisión mediante un jar personalizado. Podemos usar la siguiente forma para especificar ...

10 la respuesta

$ HADOOP_HOME está en desuso

Inicié un clúster hadoop. Recibo este mensaje de advertencia:$HADOOP_HOME is deprecated Ya agregoexport HADOOP_HOME_WARN_SUPPRESS="TRUE" dentrohadoop-env.sh Cuando inicié el clúster, no veo más mensajes de advertencia. Sin embargo, cuando ...

4 la respuesta

¿Cómo acceder y manipular los datos del archivo pdf en Hadoop?

Quiero leer el archivo PDF usando hadoop, ¿cómo es posible? Solo sé que hadoop solo puede procesar archivos txt, por lo que existe la posibilidad de analizar los archivos PDF a txt. Dame alguna sugerencia.

2 la respuesta

HBase REST Filter (SingleColumnValueFilter)

No puedo entender cómo usar los filtros en la interfaz REST de HBase (HBase 0.90.4-cdh3u3). La documentación solo me da una definición de esquema para una "cadena", pero no muestra cómo usarla. Entonces, puedo hacer esto: curl -v -H ...