Construyendo un árbol KD distribuido usando map-reduce

Estoy tratando de construir un árbol KD distribuido usando map-reduce. La descripción del árbol distribuido de KD se puede encontrar aquí.Dkd-tree

Tengo un vector de características de imágenes que tienen dimensión 20. Tengo que construir un árbol kd distribuido de acuerdo con el enlace anterior, también Echa un vistazo a esta imagenKdtree

Tengo un conjunto de millones de imágenes.Entonces, ¿qué método puedo usar para construir la parte superior del árbol (segunda parte de la imagen)? Estoy confundido en la distribución de imágenes entre los distintos nodos.

Si el árbol está construido en HDFS en la primera operación de reducción de mapa, ¿cómo puedo acceder a él en la próxima operación de reducción de mapa?

Respuestas a la pregunta(0)

Su respuesta a la pregunta