Wie funktioniert der Geohash-Index in Lucene?

Question

Mar 19, 2013, 08:14 PM

Wie funktioniert der Geohash-Index in Lucene?

In Lucene Spatial 4 frage ich mich, wie der Geohash-Index hinter den Kulissen funktioniert. Ich verstehe das Konzept der Geohash, die im Grunde genommen 2 Punkte (lat, lon) benötigt und einen einzelnen "String" -Hash erzeugt.

Ist der Index nur ein "String" -Index (R-Tree oder Quad-Tree) oder etwas in dieser Richtung (z. B. Indizieren eines Nachnamens)?

Bei voreingestellten Typ-Suchen werden alle n-Gramm des Hash indiziert, als ob es sich um eine Geohash handelt

drgt2abc wird dies indiziert als d, dr, drg, drgt, etc ..

Gibt es eine Standardanzahl von n-Gramm, die indiziert werden sollen?

Bei dieser Art der Indizierung werden Suchanfragen mit 100.000 Datensätzen verglichen mit 100 Millionen Datensätzen mit einer ähnlichen Abfrageleistung für räumliche Abfragen ausgeführt. (Wie Box / Polygon oder Abstand) oder kann ich eine allgemeine / typische langsame Verschlechterung des Index erwarten, wenn viele Datensätze hinzugefügt werden.

Vielen Dank