Comparación eficiente de 100.000 vectores

Ahorro 100.000 Vectores de en una base de datos. Cada vector tiene una dimensión 60. (int vector [60])

Entonces tomo uno y quiero presentar vectores al usuario en orden de disminuir la similitud con el elegido.

Yo sueloTanimoto Classifier para comparar 2 vectores:

¿Hay algún método para evitar hacer todas las entradas en la base de datos?

¡Una cosa más! No necesito ordenar todos los vectores en la base de datos. Quiero obtener los 20 mejores vectores más similares. Entonces, tal vez podamos limitar aproximadamente el 60% de las entradas y usar el resto para ordenar. ¿Qué piensas

Respuestas a la pregunta(20)

Su respuesta a la pregunta