Construyendo un árbol KD distribuido usando map-reduce
Estoy tratando de construir un árbol KD distribuido usando map-reduce. La descripción del árbol distribuido de KD se puede encontrar aquí.Dkd-tree
Tengo un vector de características de imágenes que tienen dimensión 20. Tengo que construir un árbol kd distribuido de acuerdo con el enlace anterior, también Echa un vistazo a esta imagenKdtree
Tengo un conjunto de millones de imágenes.Entonces, ¿qué método puedo usar para construir la parte superior del árbol (segunda parte de la imagen)? Estoy confundido en la distribución de imágenes entre los distintos nodos.
Si el árbol está construido en HDFS en la primera operación de reducción de mapa, ¿cómo puedo acceder a él en la próxima operación de reducción de mapa?