Resultados de la búsqueda a petición "mapreduce"
¿Por qué un trabajo de mapa solo en la colmena da como resultado un solo archivo de salida
Cuando ejecuto la siguiente consulta, obtengo solo un archivo como salida, aunque tengo 8 mapeadores y 0 reductores. create table table_2 as select * from table_1.Se invocan 8 mapeadores y no hay fase reductora. Solo hay un archivo en la ...
MapReduce ordenar por valor en orden descendente
Estoy tratando de escribir en pseudocódigo una tarea MapReduce que devuelve los elementos ordenados en orden descendente. Por ejemplo: para la tarea de conteo de palabras, en lugar de obtener: apple 1 banana 3 mango 2Quiero que la salida ...
Al usar Hadoop por primera vez, el trabajo MapReduce no se ejecuta Reducir fase
Escribí un trabajo de reducción de mapa simple que leería datos del DFS y ejecutaría un algoritmo simple en él. Cuando traté de depurarlo, decidí simplemente hacer que los mapeadores produjeran un solo conjunto de claves y valores, y los ...
Ejemplo de reducción de mapa de RavenDB usando .NET Client
Estoy buscando un ejemplo de cómo implementar y usar Map-Reduce dentro del cliente RavenDB .NET. Me gustaría aplicarlo a un escenario específico: generar recuentos únicos y totales de visitantes. Un documento de muestra que se almacenaría en ...
Hadoop en el servidor de Windows
Estoy pensando en usar hadoop para procesar archivos de texto grandes en mis servidores Windows 2003 existentes (alrededor de 10 máquinas de cuatro núcleos con 16 gb de RAM) Las preguntas son: ¿Hay algún buen tutorial sobre cómo configurar un ...
hadoop mapreduce: java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCodeLoader.buildSupportsSnappy () Z
Estoy tratando de escribir un archivo de secuencia comprimido de bloque rápido desde un trabajo de reducción de mapas. Estoy usando hadoop 2.0.0-cdh4.5.0 y snappy-java 1.0.4.1 Aquí está mi código: package jinvestor.jhouse.mr; import ...
¿Por qué es un bloque en HDFS tan grande?
¿Alguien puede explicar este cálculo y dar una explicación lúcida? Un cálculo rápido muestra que si el tiempo de búsqueda es de alrededor de 10 ms y la velocidad de transferencia es de 100 MB / s, para que el tiempo de búsqueda sea del 1% del ...
Ordenar mongodb por el algoritmo de clasificación de reddit
Aquí hay un código js para clasificar elementos según el algoritmo de clasificación de Reddit. Mi pregunta es: ¿cómo uso este código para clasificar mis documentos mongodb? (Algoritmo de clasificación de Reddit ...
El programa Wordcount está atascado en hadoop-2.3.0
Instalé hadoop-2.3.0 e intenté ejecutar el ejemplo de conteo de palabras, pero comienza el trabajo y permanece inactivo hadoop@ubuntu:~$ $HADOOP_HOME/bin/hadoop ...
Verifique si cada elemento de la matriz coincide con la condición
Tengo una colección de documentos: date: Date users: [ { user: 1, group: 1 } { user: 5, group: 2 } ] date: Date users: [ { user: 1, group: 1 } { user: 3, group: 2 } ]Me gustaría consultar en contra de esta colección para encontrar todos los ...