Resultados de la búsqueda a petición "elastic-map-reduce"

14 la respuesta

Programar un trabajo en AWS EC2

Tengo un sitio web que se ejecuta en AWS EC2. Necesito crear un trabajo nocturno que genere un archivo de mapa del sitio y suba los archivos a los distintos navegadores. Estoy buscando una utilidad en AWS que permita esta funcionalidad. He ...

2 la respuesta

hadoop convirtiendo \ r \ n a \ ny rompiendo el formato ARC

Estoy tratando de analizar datos de commoncrawl.org usando hadoop streaming. Configuré un hadoop local para probar mi código, y tengo un mapeador Ruby simple que usa un lector de archivos ARC. Cuando invoco mi código yo mismo como cat ...

4 la respuesta

¿Cómo especificar configuraciones mapeadas y opciones de Java con jar personalizado en CLI usando EMR de Amazon?

Me gustaría saber cómo especificar configuraciones de mapreduce como mapred.task.timeout, mapred.min.split.size etc., cuando se ejecuta un trabajo de transmisión mediante un jar personalizado. Podemos usar la siguiente forma para especificar ...

6 la respuesta

Exportando tabla de colmena a un cubo S3

Creé una tabla de colmena a través de una sesión interactiva de Elastic MapReduce y la llené de un archivo CSV como este: CREATE TABLE csvimport(id BIGINT, time STRING, log STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'; LOAD DATA LOCAL ...