Suchergebnisse für Anfrage "minhash"
Wählen zwischen SimHash und MinHash für ein Produktionssystem
Ich bin mit den LSH-Techniken (Locality Sensitive Hashing) von SimHash und MinHash vertraut. SimHash verwendet Cosinus-Ähnlichkeit gegenüber reellen Daten. MinHash berechnet Ähnlichkeit über binäre Vektoren. Aber ich kann mich nicht entscheiden, ...
Generieren von zufälligen Hash-Funktionen für den LSH-Minhash-Algorithmus
Ich programmiere einen Minhashing-Algorithmus in Java, der es erfordert, dass ich eine beliebige Anzahl zufälliger Hash-Funktionen (in meinem Fall 240 Hash-Funktionen) generiere und eine beliebige Anzahl von ganzen Zahlen durchlaufe (im Moment ...