Resultados da pesquisa a pedido "minhash"

2 a resposta

Escolhendo entre SimHash e MinHash para um sistema de produção

Eu estou familiarizado com as técnicas LSH (Locality Sensitive Hashing) do SimHash e MinHash. O SimHash usa semelhança de cosseno em dados com valores reais. O MinHash calcula a semelhança de semelhança sobre vetores binários. Mas não consigo ...

1 a resposta

Semelhança de string com a condição OR no MinHash Spark ML

Eu tenho dois conjuntos de dados, o primeiro é um grande conjunto de dados de referência e do segundo conjunto de dados encontrará a melhor correspondência do primeiro conjunto de dados através do algoritmo MinHash. val dataset1 = ...

2 a resposta

Gerando funções de hash aleatórias para o algoritmo LSH Minhash

Estou programando um algoritmo minhashing em Java que exige que eu gere um número arbitrário de funções aleatórias de hash (240 funções hash no meu caso) e execute qualquer número de números inteiros por ele (2000 no momento). Para fazer isso, ...