Resultados de la búsqueda a petición "apache-pig"
encontrar significa usar cerdo o hadoop
Tengo un enorme archivo de texto de forma.los datos se guardan en el directorio data / data1.txt, data2.txt y así sucesivamente
¿Cómo se mejora el rendimiento en un trabajo porcino que tiene datos muy sesgados?
Estoy ejecutando un script pig que realiza un GROUP BY y un FOREACH anidado que tarda horas en ejecutarse debido a una o dos tareas de reducción. Por ejemplo:
Pig UDF se ejecuta en AWS EMR con java.lang.NoClassDefFoundError: org / apache / pig / LoadFunc
Estoy desarrollando una aplicación que intenta leer el archivo de registro almacenado en bucles S3 y analizarlo utilizando Elastic MapReduce. Actual el archi...
PIG UDF maneja la tupla de líneas múltiples dividida en un mapeador diferente
Tengo un archivo donde cada tupla abarca varias líneas, por ejemplo:
como cancelar el comando en el shell GRUNT
Esta es probablemente una pregunta más general: muchas herramientas en Linux tienen sus propios shells. En mi caso, uso cerdo y hbase. A veces, cuando ejecut...
CDH4 Hbase utilizando Pig ERROR 2998 java.lang.NoClassDefFoundError: org / apache / hadoop / hbase / filter / Filter
Estoy usando CDH4 en un modo pseudo-distribuido y tengo algunos problemas para trabajar con HBase y Pig juntos (pero ambos funcionan bien solo).Estoy siguien...