Resultados de la búsqueda a petición "hadoop"
Transferencias lentas en Jetty con codificación de transferencia fragmentada en cierto tamaño de búfer
Estoy investigando un problema de rendimiento con Jetty 6.1.26. Jetty parece usarTransfer-Encoding: chunked, y dependiendo del tamaño del búfer utilizado, esto puede ser muy lento cuando se transfiere localmente. He creado una pequeña ...
Hadoop performance
I instalé hadoop 1.0.0 y probé el ejemplo de conteo de palabras (clúster de nodo único). Tardaron 2m 48 segundos en completarse. Luego probé el programa estándar de conteo de palabras de Linux, que se ejecuta en 10 milisegundos en el ...
Hadoop Job: la tarea no puede informar el estado durante 601 segundos
Mientras se ejecuta el trabajo de hadoop en pseudonodo, la tarea falla y fue asesinada. Error: la tarea intento_ no puede informar el estado durante 601 segundos Pero el mismo programa se ejecuta a través de Eclipse (trabajo local). Task: hay ...
JAVA_HOME no configura
Mientras trabajaba en Hadoopmplementación de @ en operación pseudo-distribuida, encontré la siguiente excepción de JAVA_HOME variable no configurada, pero cuando traté de repetirla, se configuró. Variable está preestablecido enconf/hadoop-env.sh ...
¿Cómo usar Sqoop en el programa Java?
Sé cómo usar sqoop a través de la línea de comandos. Pero no sé cómo llamar al comando sqoop usando programas java. ¿Alguien puede dar alguna vista de código?
Escribiendo el código MApreduce para contar el número de registros
Quiero escribir un código de reducción de mapas para contar el número de registros en un archivo CSV dado. No entiendo qué hacer en el mapa y qué hacer para reducir, ¿cómo debo resolver esto? ¿Alguien puede sugerir algo?
¿Cómo especificar configuraciones mapeadas y opciones de Java con jar personalizado en CLI usando EMR de Amazon?
Me gustaría saber cómo especificar configuraciones de mapreduce como mapred.task.timeout, mapred.min.split.size etc., cuando se ejecuta un trabajo de transmisión mediante un jar personalizado. Podemos usar la siguiente forma para especificar ...
$ HADOOP_HOME está en desuso
Inicié un clúster hadoop. Recibo este mensaje de advertencia:$HADOOP_HOME is deprecated Ya agregoexport HADOOP_HOME_WARN_SUPPRESS="TRUE" dentrohadoop-env.sh Cuando inicié el clúster, no veo más mensajes de advertencia. Sin embargo, cuando ...
¿Cómo acceder y manipular los datos del archivo pdf en Hadoop?
Quiero leer el archivo PDF usando hadoop, ¿cómo es posible? Solo sé que hadoop solo puede procesar archivos txt, por lo que existe la posibilidad de analizar los archivos PDF a txt. Dame alguna sugerencia.
HBase REST Filter (SingleColumnValueFilter)
No puedo entender cómo usar los filtros en la interfaz REST de HBase (HBase 0.90.4-cdh3u3). La documentación solo me da una definición de esquema para una "cadena", pero no muestra cómo usarla. Entonces, puedo hacer esto: curl -v -H ...