Resultados de la búsqueda a petición "hadoop"

17 la respuesta

¿Diferencia entre las tablas internas de Hive y las tablas externas?

2 la respuesta

Colmena - Operador LIKE

No puedo entender cómo trato ese problema: Esta es mi información: Table1: Table2: BRAND PRODUCT SOLD Sony Sony ABCD 1233 Apple Sony adv 1233 Google Sony aaaa 1233 IBM Apple 123 1233 etc. Apple 345 1233 IBM 13123 1233¿Es posible filtrar la ...

2 la respuesta

¿Cómo manejas los archivos de entrada vacíos o faltantes en Apache Pig?

Nuestro flujo de trabajo utiliza un mapa elástico de AWS que reduce el clúster para ejecutar una serie de trabajos de Pig para manipular una gran cantidad de datos en informes agregados. Desafortunadamente, los datos de entrada son potencialmente ...

2 la respuesta

La operación de reducción de mapa de Hadoop falla al escribir la salida

Finalmente puedo iniciar un trabajo de reducción de mapas en Hadoop (ejecutándose en una sola máquina Debian). Sin embargo, el trabajo de reducción de mapas siempre falla con el siguiente error: hadoopmachine@debian:~$ ./hadoop-1.0.1/bin/hadoop ...

1 la respuesta

Excepción en el subproceso "main" org.apache.hadoop.ipc.RemoteException: el servidor IPC versión 9 no puede comunicarse con el cliente versión 4. ¿Cómo resolver esto?

Estoy usando hadoop 2.7.0 y java oracle jdk1.7.0_79 con NetBeans IDE 8.0.2. Cuando intento comunicarme con Hadoop usando el archivo Java, aparece el siguiente error. ¿Hay algún problema de dependencia involucrado? ¿O cómo puedo resolver este ...

4 la respuesta

Descomprime archivos usando streaming de hadoop

Tengo muchos archivos en HDFS, todos ellos un archivo zip con un archivo CSV dentro. Estoy tratando de descomprimir los archivos para poder ejecutar un traba...

2 la respuesta

La renovación automática del ticket Kerberos no funciona desde Java

En mi aplicación de servidor, me estoy conectando al clúster Hadoop seguro de Kerberos desde mi aplicación java. En el inicio de la aplicación llamo UserGroupInformation.loginUserFromKeytabAndReturnUGI( ... );Estoy haciendo operaciones básicas ...

2 la respuesta

¿Qué idioma usar para los programas Hadoop Map / Reduce? Java o PHP?

Recientemente escribí un par de programas de mapa / reducción en Java. Pero también sé que también se puede usar lenguaje de script como php. Sin embargo, casi todos recomiendan java o python. Actualmente trabajo en php. Entonces, me preguntaba ...

1 la respuesta

Reenviar los valores faltantes en Spark / Python

Estoy tratando de completar los valores faltantes en mi marco de datos de Spark con el valor anterior no nulo (si existe). He hecho este tipo de cosas en Python / Pandas pero mis datos son demasiado grandes para Pandas (en un grupo pequeño) y soy ...

1 la respuesta

Clasificación secundaria en Mapa-Reducir