Elasticsearch - EdgeNgram + highlight + term_vector = schlechte highlights
Wenn ich einen Analysator mit Edgengramm (min = 3, max = 7, front) + term_vector = with_positions_offsets benutze
Mit Dokument mit text = "CouchDB"
Wenn ich nach "couc" suche
Mein Highlight ist "cou" und nicht "couc"
Es scheint, dass mein Highlight nur auf dem minimalen passenden Token "cou" liegt, während ich erwarten würde, auf dem genauen Token (wenn möglich) oder zumindest dem längsten gefundenen Token zu sein.
Es funktioniert gut, ohne den Text mit term_vector = with_positions_offsets zu analysieren
Welche Auswirkungen hat das Entfernen von term_vector = with_positions_offsets für Perfomances?