Elasticsearch - EdgeNgram + highlight + term_vector = złe podświetlenia

Kiedy używam analizatora z edgengramem (min = 3, max = 7, front) + term_vector = with_positions_offsets

Z dokumentem mającym tekst = „CouchDB”

Kiedy szukam „couc”

Moje wyróżnienie to „cou”, a nie „couc”

Wygląda na to, że moje wyróżnienie dotyczy tylko minimalnego pasującego tokena „cou”, podczas gdy spodziewałbym się, że znajduję się na dokładnym tokenie (jeśli to możliwe) lub przynajmniej na najdłuższym znalezionym tokenie.

Działa dobrze bez analizy tekstu za pomocą term_vector = with_positions_offsets

Jaki jest wpływ usunięcia term_vector = with_positions_offsets dla perfomances?

questionAnswers(2)

yourAnswerToTheQuestion