Resultados de la búsqueda a petición "hive"
Parquet vs ORC vs ORC con Snappy
Estoy ejecutando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que ...
Cola de trabajo para la acción de la colmena en oozie
Tengo un flujo de trabajo oozie. Estoy enviando todas las acciones de la colmena con <name>mapred.job.queue.name</name> <value>${queueName}</value>Pero para algunas acciones de la colmena, el trabajo iniciado no está en la cola especificada; ...
Colmena: funcionalidad Univivot en la colmena
Tengo dos tablas de la siguiente manera: Tabla A userid | code | code_name | property_id 0001 | 1 | apple_id | Y1234 0031 | 4 | mango_id | G4567 0008 | 3 | grape_id | H1209 00013 | 2 | peach_id | Z5643Tabla 2 apple_id | mango_id | grape_id | ...
Spark data type adivinador UDAF
Quería tomar algo como esto https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java [https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java]y cree un HDAF Hive para crear una función agregada que ...
¿Dónde está el error de sintaxis en esta simple consulta de Hive con STRUCT?
Importemos una tabla simple en Hive: hive> CREATE EXTERNAL TABLE tweets (id BIGINT, id_str STRING, user STRUCT<id:BIGINT, screen_name:STRING>) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde' LOCATION '/projets/tweets'; OK Time ...
Colmena: conversión de la matriz <cadena> a la matriz <int> en la consulta
Tengo dos mesas : create table a ( `1` array<string>); create table b ( `1` array<int>);y quiero poner la tabla a en la tabla b (la tabla b está vacía): insert into table b select * from a;Al hacerlo me sale el siguiente error: FAILED: ...
Muestras aleatorias de tamaño coincidente de la tabla de la colmena
Tengo una mesa colmenaactivity con columnasuserid, itemidyrating, con posibles calificaciones de 1 y 0, en las que hay muchas más calificaciones positivas (1s) que negativas (0s). Necesito extraer una muestra con números aproximadamente iguales ...
Las marcas de tiempo de Impala no coinciden con Hive: ¿un problema de zona horaria?
Tengo algunos datos de registro de eventos en HDFS que, en su formato sin formato, se ve así: 2015-11-05 19:36:25.764 INFO [...etc...]Una tabla externa apunta a esta ubicación HDFS: CREATE EXTERNAL TABLE `log_stage`( `event_time` timestamp, ...
Problemas con la ejecución de múltiples consultas usando Spark y HiveSQL
Espero que alguien pueda ayudarme con este problema. Dentro de spark-shell donde si intento algo como a continuación: var sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) var query = "select * from myDB.table limit 10; drop table if ...
Cómo obtener la diferencia de fecha en minutos usando Hive
La siguiente consulta es mi consulta de servidor sql y quiero que la convierta en consulta de colmena: select DATEDIFF([minute], '19000101', '2013-01-01 10:10:10')