Jak działa indeks geohash w Lucene
W lucene spatial 4 zastanawiam się, jak indeks geohash działa za kulisami. Rozumiem koncepcję geohasha, która w zasadzie zajmuje 2 punkty (lat, lon) i tworzy pojedynczy „ciąg” mieszania.
Czy indeks jest tylko indeksem „string” (r-tree lub quad-tree) lub czymś w tym rodzaju (np. Po prostu indeksuje nazwisko) ..... czy jest w tym coś wyjątkowego.
W przypadku wyszukiwania wstępnie ustalonego typu wszystkie n-gramy skrótu są indeksowane, tak jakby geohash był
drgt2abc robi to indeksowane jako d, dr, drg, drgt itp.
Czy istnieje domyślna liczba n-gramów, które możemy zindeksować?
W przypadku tego typu indeksowania zapytania będą wyszukiwane w 100 tysiącach rekordów, a 100 milionów rekordów ma podobną wydajność zapytań dla zapytań przestrzennych. (Takich jak pudełko / wielokąt lub odległość) lub mogę się spodziewać ogólnego / typowego powolnego rozkładu indeksu, gdy dodawanych jest wiele rekordów.
Dzięki