Comparação eficiente de 100.000 vetores

Eu salvo 100.000 vetores em um banco de dados. Cada vetor tem uma dimensão 60. (int vector [60])

Então eu pego um e quero vetores atuais para o usuário em ordem decrescente de similaridade com o escolhid

Eu usoTanimoto Classifier para comparar 2 vetores:

Existe algum método para evitar passar por todas as entradas no banco de dado

Mais uma coisa! Não preciso classificar todos os vetores no banco de dados. Eu gostaria de obter no top 20 os vetores mais semelhantes. Portanto, talvez possamos limiar aproximadamente 60% das entradas e usar o restante para classificação. O que você acha

questionAnswers(20)

yourAnswerToTheQuestion