Resultados de la búsqueda a petición "apache-pig"
Mapa de cerdo vs Hive vs Reducir
Tengo conocimientos básicos sobre qué son las abstracciones de Pig, Hive. Pero no tengo una idea clara sobre los escenarios que requieren la reducción de Hiv...
Extrae la primera línea del archivo CSV en Pig
Tengo varios archivos CSV y el encabezado es siempre la primera línea del archivo. ¿Cuál es la mejor manera de sacar esa línea del archivo CSV como una caden...
¿Cómo realizar un DISTINCT en Pig Latin en un subconjunto de columnas?
Me gustaría realizar una operación DISTINCT en un subconjunto de las columnas. losdocumentación Dice que esto es posible con un foreach anidado:No puede util...
Pig & Cassandra & DataStax Splits Control
He estado usando Pig con mis datos de Cassandra para hacer todo tipo de increíbles hazañas de agrupaciones que serían casi imposibles de escribir de forma im...
Pasando una lista a Javascript UDF en Apache Pig
Si tengo una variedad de cosas en Pig, así:
bolsa de cerdo latino a tupla después de grupo por
Tengo los siguientes datos con esquema.
Pig: cargando un archivo de datos usando un archivo de esquema externo
Tengo un archivo de datos y un archivo de esquema correspondiente almacenados en ubicaciones separadas. Me gustaría cargar los datos utilizando el esquema en...
Pig problema por defecto del esquema de JsonLoader
Tengo los siguientes datos que deben analizarse utilizando PigDatos
Pig: ¿es posible escribir un ciclo sobre las variables en una lista?
Tengo que recorrer más de 30 variables en una lista [var1,var2, ... , var30] y para cada variable uso un poco de PIGgroup by declaración como grouped = GROUP data by var1; data_var1 = FOREACH grouped{ GENERATE group as mygroup, COUNT(data) as ...