Jak działa indeks geohash w Lucene

Question

Mar 19, 2013, 08:14 PM

Jak działa indeks geohash w Lucene

W lucene spatial 4 zastanawiam się, jak indeks geohash działa za kulisami. Rozumiem koncepcję geohasha, która w zasadzie zajmuje 2 punkty (lat, lon) i tworzy pojedynczy „ciąg” mieszania.

Czy indeks jest tylko indeksem „string” (r-tree lub quad-tree) lub czymś w tym rodzaju (np. Po prostu indeksuje nazwisko) ..... czy jest w tym coś wyjątkowego.

W przypadku wyszukiwania wstępnie ustalonego typu wszystkie n-gramy skrótu są indeksowane, tak jakby geohash był

drgt2abc robi to indeksowane jako d, dr, drg, drgt itp.

Czy istnieje domyślna liczba n-gramów, które możemy zindeksować?

W przypadku tego typu indeksowania zapytania będą wyszukiwane w 100 tysiącach rekordów, a 100 milionów rekordów ma podobną wydajność zapytań dla zapytań przestrzennych. (Takich jak pudełko / wielokąt lub odległość) lub mogę się spodziewać ogólnego / typowego powolnego rozkładu indeksu, gdy dodawanych jest wiele rekordów.

Dzięki