¿Cómo agrupar hashes sensibles a la localidad?
Ya tengo el algoritmo para producir hashes sensibles a la localidad, pero ¿cómo debo agruparlos para aprovechar sus características (es decir, elementos similares tienen hashes cercanos (con la distancia de hamming))?
En el código matlab encontré que simplemente crean una matriz de distancia entre los valores hash de los puntos a buscar y los valores hash de los puntos en la base de datos, para simplificar el código, mientras hacen referencia a un método llamado Charikar para una implementación realmente buena del método de búsqueda.
Intenté buscar eso, pero no estoy seguro de cómo aplicar a mi caso cualquiera de los métodos que encontré (como el método de múltiples sondas). Ninguna de estas técnicas parece fácilmente conectable si ya tiene los hashes. ¿Hay algún código de ejemplo simple para esto? ¿O alguna sugerencia?
Este es el enlace a la página con el código matlab del que estoy hablando:http: //www.eecs.berkeley.edu/~kulis/klsh/klsh.ht