El resaltado de Elasticsearch en el filtro ngram es extraño si min_gram se establece en 1
Así que tengo este índice
{
"settings":{
"index":{
"number_of_replicas":0,
"analysis":{
"analyzer":{
"default":{
"type":"custom",
"tokenizer":"keyword",
"filter":[
"lowercase",
"my_ngram"
]
}
},
"filter":{
"my_ngram":{
"type":"nGram",
"min_gram":2,
"max_gram":20
}
}
}
}
}
}
y estoy realizando esta búsqueda a través de la gema del neumático
{
"query":{
"query_string":{
"query":"xyz",
"default_operator":"AND"
}
},
"sort":[
{
"count":"desc"
}
],
"filter":{
"term":{
"active":true,
"_type":null
}
},
"highlight":{
"fields":{
"name":{
}
},
"pre_tags":[
"<strong>"
],
"post_tags":[
"</strong>"
]
}
}
y tengo dos publicaciones que deben coincidir con el nombre 'publicación xyz' y 'pregunta xyz'. Cuando realizo esta búsqueda, recupero los campos resaltados correctamente
<strong>xyz</strong> question
<strong>xyz</strong> post
Ahora aquí está la cosa ... tan pronto como cambie min_gram a 1 en mi índice y reindexar. Los campos resaltados comienzan a regresar ya que esto
<strong>x</strong><strong>y</strong><strong>z</strong> pos<strong>xyz</strong>t
<strong>x</strong><strong>y</strong><strong>z</strong> questio<strong>xyz</strong>n
Simplemente no puedo entender por qué.