Получение наиболее вероятных документов запроса с использованием фонетического фильтра в solr
я используюSolr запроверка орфографии / исправление запроса, я добавилsolr.PhoneticFilterFactory а такжеsolr.NGramFilterFactory в fieldType выполнитьпроверка орфографии, этоработает нормально но здесьпроблема это яполучение количества документов запроса. Мне нужно тольконаиболее вероятные слова / документы или похожими словами, мы можем сказать, чтоближе слова / документы кзапрос.
Фрагментschema.xml :
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<filter class="solr.TrimFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="1000" />
<filter class="solr.LowerCaseFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<filter class="solr.TrimFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
</analyzer>
</fieldType>
пример : Длязапрос "кусок". Я обхожу780 NumFound(Количество документов). Мне необходимоуменьшить это считается, но снаиболее вероятное количество документов.