Wie funktioniert der Geohash-Index in Lucene?
In Lucene Spatial 4 frage ich mich, wie der Geohash-Index hinter den Kulissen funktioniert. Ich verstehe das Konzept der Geohash, die im Grunde genommen 2 Punkte (lat, lon) benötigt und einen einzelnen "String" -Hash erzeugt.
Ist der Index nur ein "String" -Index (R-Tree oder Quad-Tree) oder etwas in dieser Richtung (z. B. Indizieren eines Nachnamens)?
Bei voreingestellten Typ-Suchen werden alle n-Gramm des Hash indiziert, als ob es sich um eine Geohash handelt
drgt2abc wird dies indiziert als d, dr, drg, drgt, etc ..
Gibt es eine Standardanzahl von n-Gramm, die indiziert werden sollen?
Bei dieser Art der Indizierung werden Suchanfragen mit 100.000 Datensätzen verglichen mit 100 Millionen Datensätzen mit einer ähnlichen Abfrageleistung für räumliche Abfragen ausgeführt. (Wie Box / Polygon oder Abstand) oder kann ich eine allgemeine / typische langsame Verschlechterung des Index erwarten, wenn viele Datensätze hinzugefügt werden.
Vielen Dank