Resultados da pesquisa a pedido "minhash"
Escolhendo entre SimHash e MinHash para um sistema de produção
Eu estou familiarizado com as técnicas LSH (Locality Sensitive Hashing) do SimHash e MinHash. O SimHash usa semelhança de cosseno em dados com valores reais. O MinHash calcula a semelhança de semelhança sobre vetores binários. Mas não consigo ...
Semelhança de string com a condição OR no MinHash Spark ML
Eu tenho dois conjuntos de dados, o primeiro é um grande conjunto de dados de referência e do segundo conjunto de dados encontrará a melhor correspondência do primeiro conjunto de dados através do algoritmo MinHash. val dataset1 = ...
Gerando funções de hash aleatórias para o algoritmo LSH Minhash
Estou programando um algoritmo minhashing em Java que exige que eu gere um número arbitrário de funções aleatórias de hash (240 funções hash no meu caso) e execute qualquer número de números inteiros por ele (2000 no momento). Para fazer isso, ...