Resultados de la búsqueda a petición "hive"

5 la respuesta

Parquet vs ORC vs ORC con Snappy

Estoy ejecutando algunas pruebas en los formatos de almacenamiento disponibles con Hive y usando Parquet y ORC como opciones principales. Incluí ORC una vez con compresión predeterminada y una vez con Snappy. He leído muchos documentos que ...

1 la respuesta

Cola de trabajo para la acción de la colmena en oozie

Tengo un flujo de trabajo oozie. Estoy enviando todas las acciones de la colmena con <name>mapred.job.queue.name</name> <value>${queueName}</value>Pero para algunas acciones de la colmena, el trabajo iniciado no está en la cola especificada; ...

2 la respuesta

Colmena: funcionalidad Univivot en la colmena

Tengo dos tablas de la siguiente manera: Tabla A userid | code | code_name | property_id 0001 | 1 | apple_id | Y1234 0031 | 4 | mango_id | G4567 0008 | 3 | grape_id | H1209 00013 | 2 | peach_id | Z5643Tabla 2 apple_id | mango_id | grape_id | ...

1 la respuesta

Spark data type adivinador UDAF

Quería tomar algo como esto https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java [https://github.com/fitzscott/AirQuality/blob/master/HiveDataTypeGuesser.java]y cree un HDAF Hive para crear una función agregada que ...

1 la respuesta

¿Dónde está el error de sintaxis en esta simple consulta de Hive con STRUCT?

Importemos una tabla simple en Hive: hive> CREATE EXTERNAL TABLE tweets (id BIGINT, id_str STRING, user STRUCT<id:BIGINT, screen_name:STRING>) ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.JsonSerde' LOCATION '/projets/tweets'; OK Time ...

2 la respuesta

Colmena: conversión de la matriz <cadena> a la matriz <int> en la consulta

Tengo dos mesas : create table a ( `1` array<string>); create table b ( `1` array<int>);y quiero poner la tabla a en la tabla b (la tabla b está vacía): insert into table b select * from a;Al hacerlo me sale el siguiente error: FAILED: ...

3 la respuesta

Muestras aleatorias de tamaño coincidente de la tabla de la colmena

Tengo una mesa colmenaactivity con columnasuserid, itemidyrating, con posibles calificaciones de 1 y 0, en las que hay muchas más calificaciones positivas (1s) que negativas (0s). Necesito extraer una muestra con números aproximadamente iguales ...

3 la respuesta

Las marcas de tiempo de Impala no coinciden con Hive: ¿un problema de zona horaria?

Tengo algunos datos de registro de eventos en HDFS que, en su formato sin formato, se ve así: 2015-11-05 19:36:25.764 INFO [...etc...]Una tabla externa apunta a esta ubicación HDFS: CREATE EXTERNAL TABLE `log_stage`( `event_time` timestamp, ...

1 la respuesta

Problemas con la ejecución de múltiples consultas usando Spark y HiveSQL

Espero que alguien pueda ayudarme con este problema. Dentro de spark-shell donde si intento algo como a continuación: var sqlContext = new org.apache.spark.sql.hive.HiveContext(sc) var query = "select * from myDB.table limit 10; drop table if ...

1 la respuesta

Cómo obtener la diferencia de fecha en minutos usando Hive

La siguiente consulta es mi consulta de servidor sql y quiero que la convierta en consulta de colmena: select DATEDIFF([minute], '19000101', '2013-01-01 10:10:10')