Resultados de la búsqueda a petición "hive"

3 la respuesta

¿Cómo cambiar el formato de fecha en la colmena?

Mi tabla en la colmena tiene una fecha de presentación en el formato de "2016/06/01". pero encuentro que no es perjudicial con el formato '2016-06-01'. No se pueden comparar, por ejemplo. Ambos son cuerdas. Así que quiero saber cómo hacerlos ...

1 la respuesta

Cómo optimizar el escaneo de 1 archivo / tabla enorme en Hive para confirmar / verificar si el punto lat largo está contenido en una forma de geometría wkt

Actualmente estoy tratando de asociar cada ping largo lat de un dispositivo a su código postal. He desnormalizado los datos de ping del dispositivo de longitud larga y he creado una tabla de unión de productos cruzados / producto cartesiano en ...

2 la respuesta

¿Cómo deshacer datos con SparkR?

UtilizandoSparkR ¿Cómo se pueden "explotar" las matrices anidadas? He intentado usarexplode al igual que: dat <- nested_spark_df %>% mutate(a=explode(metadata)) %>% head()pero aunque lo anterior no provoca una excepción, no promueve los campos ...

1 la respuesta

¿Cuáles son los formatos de archivo de secuencia y los formatos de parquet en colmena?

¿Puede explicar con un ejemplo en tiempo real dónde usar el archivo de secuencia y el archivo de parquet?

4 la respuesta

Se produce un error al obtener un archivo al importar a Hive usando sqoop

Estoy tratando de copiar las tablas de la base de datos retail_db en la base de datos de la colmena que ya he creado. Cuando ejecuto el siguiente código sqoop import-all-tables \ --num-mappers 1 \ ...

3 la respuesta

Cargue datos en Hive con delimitador personalizado

Estoy tratando de crear una tabla interna (administrada) en la colmena que pueda almacenar mis datos de registro incrementales. La tabla dice así: CREATE TABLE logs (foo INT, bar STRING, created_date TIMESTAMP) ROW FORMAT DELIMITED FIELDS ...

1 la respuesta

Error al conectar la aplicación node.js a la colmena

He usado node-hive y thrift para conectar mi aplicación node js a la colmena, pero ninguno de ellos funciona. ¿Hay algún otro módulo de nodo para conectarse a la colmena?

2 la respuesta

Importar Sqoop dividir por tipo de columna de datos

¿El tipo de datos de Split by column en la importación sqoop siempre debe ser un tipo de datos numérico (entero, bignint, numérico)? ¿No puede ser una cuerda?

2 la respuesta

Consulta más eficiente para evitar OutOfMemoryError en Hive

Estoy obteniendo un java.lang.OutOfMemoryError: límite de sobrecarga del GC excedido en Hive. Al buscar, descubrí que se debe a que el 98% de todo el tiempo de CPU del proceso va a la recolección de basura (lo que sea que eso signifique) ¿Es el ...

1 la respuesta

Extraer partición de tabla de colmena en Spark - java

¿Hay alguna forma en Spark para extraer solo los nombres de columna de partición? La solución que estoy usando es ejecutar "show extended table like table_name" utilizandoHiveContext