Resultados de la búsqueda a petición "hadoop"
cuántos mapeadores y reductores se crearán para una tabla dividida en colmena
Siempre estoy confundido sobre cuántos mapeadores y reductores se crearán para una tarea particular en la colmena. por ejemplo, si el tamaño del bloque = 128 mb y hay 365 archivos cada uno se asigna a una fecha en un año (tamaño del archivo = 1 ...
Error de trabajo de transmisión de Hadoop (no exitoso) en Python
Estoy tratando de ejecutar un trabajo Map-Reduce en Hadoop Streaming con scripts Python y obtengo los mismos errores queError de trabajo de transmisión de Hadoop en ...
Crear una sección de tabla externa, la ubicación contiene varios archivos dentro
CREATE EXTERNAL TABLE IF NOT EXISTS LOGS (LGACT STRING,NTNAME STRING) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LOCATION '/user/hive/warehouse/LOGS/test';En la carpeta 'prueba', estoy escribiendo archivos a diario. por ...
¿Qué hace realmente la fase de barajado?
¿Qué hace realmente la fase de barajado? A) Como barajar es el proceso de llevar el mapeador o / p al reductor o / p, solo trae las teclas específicas de los mapeadores a los reductores particulares basados en el código escrito en el ...
¿Qué es exactamente la configuración del quórum zookeeper en hbase-site.xml?
¿Qué es exactamente la configuración del quórum zookeeper en hbase-site.xml?
¿Por qué no se implementa Hadoop usando MPI?
Corrígeme si me equivoco, pero entiendo que Hadoop no usa MPI para la comunicación entre diferentes nodos. ¿Cuáles son las razones técnicas para esto? Podría hacer algunas conjeturas, pero no sé lo suficiente de cómo se implementa MPI "bajo el ...
Construya Apache Hadoop desde la fuente en OS X en 2017
Hasta ahora he bifurcado el repositorio de Git: https://github.com/apache/hadoopHe estado buscando información sobre cómo construir desde la fuente, he probado este comando: mvn package -Pdist -Dtar -DskipTestsque resultó en el siguiente ...
Error de compilación de Hadoop en Windows: ¿falta zconf.h en native.sln?
Estoy tratando de construir la siguiente versión de hadoop en la computadora de desarrollo con Windows 10 Home Edition hadoop-2.7.3-src Aquí están los detalles sobre mi entorno de desarrollo local: -Windows 10 Home Edition -Intel Core ...
¿Cómo eliminar duplicados en la cadena de la colmena?
Tengo una columna (cadena) separada por comas con valores duplicados. Quiero eliminar duplicados: p.ej. nombre_columna ----------------- pistola, pistola, hombre, pistola, hombre lanzadera, enemigo, enemigo, correr golpear, perseguir Quiero un ...
Evite la creación de _ $ folder $ keys en S3 con hadoop (EMR)
Estoy usando una actividad EMR en la tubería de datos de AWS. Esta actividad de EMR ejecuta un script de colmena en el clúster de EMR. Toma dynamo DB como entrada y almacena datos en S3. Este es el paso EMR utilizado en la actividad ...