Resultados de la búsqueda a petición "hadoop"
¿Vale la pena comprar Mahout en acción para ponerse al día con Mahout, o hay otras fuentes mejores?
Actualmente soy un usuario muy casual deApache Mahout [http://mahout.apache.org/]y estoy considerando comprar el libroMahout en acción [http://www.manning.com/owen/]. Desafortunadamente, me está costando mucho tener una idea de lo valioso que es ...
¿Las uniones implícitas de Hive son siempre uniones internas?
losunirse a la documentación [https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Joins]for Hive alienta el uso de uniones implícitas, es decir SELECT * FROM table1 t1, table2 t2, table3 t3 WHERE t1.id = t2.id AND t2.id = t3.id AND ...
Error de tiempo de ejecución de JAVA: java.lang.UnsupportedClassVersionError. Major.minor versión 51.0 no compatible
Estoy tratando de ejecutar el conjunto de pruebas PUMA (Purdue Mapreduce Benchmarks Suite: para hadoop). Ejecuté una aplicación (recuento de palabras) de manera adecuada, pero no pude ejecutar la otra (índice invertido). Se produce un error en ...
¿Por qué falla "hadoop fs -mkdir" con Permiso denegado?
Estoy usando Cloudera en una máquina virtual con la que estoy jugando. Desafortunadamente, tengo problemas para copiar datos al HDFS, obtengo lo siguiente: [cloudera@localhost ~]$ hadoop fs -mkdir input mkdir: Permission denied: user=cloudera, ...
Sqoop: no se pudo cargar la excepción del controlador mysql
Instalé Sqoop en mi máquina local. Los siguientes son la información de configuración. Bash.bashrc: export HADOOP_HOME=/home/hduser/hadoop export HBASE_HOME=/home/hduser/hbase export HIVE_HOME=/home/hduser/hive export ...
Acceda a un Hive seguro cuando ejecute Spark en un clúster YARN no seguro
Tenemos dos clústeres de cloudera 5.7.1, uno protegido con Kerberos y otro no seguro. ¿Es posible ejecutar Spark utilizando el clúster YARN no seguro mientras se accede a las tablas de la colmena almacenadas en el clúster seguro? (La versión de ...
Consulta de unión temporal en colmena (eventos muy próximos en el tiempo)
Necesito una consulta de colmena que estoy teniendo dificultades para resolver. Tengo una serie de tiempo que se ve así: time source word1 word2 ...etc 2012-02-01 23:43:16.9988243 0001 2B3B FAF0 2012-02-01 23:43:16.9993561 0002 2326 ABAA ...
¿Cómo generar series de fechas en HIVE? (Creando tabla)
Supongamos que actualmente tengo una tabla que tiene 1 fila para cada cuenta y los datos en las tablas son: Número de cuentaFecha de inicioFecha finalAhora me gustaría crear una nueva tabla que tenga 1 fila para cada día que la cuenta esté ...
Error de conectividad JDBC Kerberos de Hive
Estoy tratando de conectarme a Hive-Server2 a través de JDBC. El servidor está habilitado para kerberos. Estoy usando el siguiente código, estoy ejecutando el código de un nodo de borde donde está presente el archivo de tabla de claves ¿Qué me ...
SPARK SQL falla si no hay una ruta de partición especificada disponible
Estoy usando Hive Metastore en EMR. Puedo consultar la tabla manualmente a través de HiveSQL. Pero cuando uso la misma tabla en Spark Job, diceLa ruta de entrada no existe: s3: // Causado por: org.apache.hadoop.mapred.InvalidInputException: la ...