Obtendo documentos mais prováveis da consulta usando filtro fonético no solr
estou usandosolr paraverificação ortográfica / correção de consultas. Eu adicioneisolr.PhoneticFilterFactory esolr.NGramFilterFactory em fieldType para executarverificação ortográfica. Isto étrabalhando bem mas aqui oproblema é que eu souobtendo número de documentos da consulta. Eu só precisopalavras / documentos mais prováveis ou em palavras semelhantes, podemos dizer quepalavras / documentos mais próximos aoinquerir.
Snippet deschema.xml :
<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<filter class="solr.TrimFilterFactory"/>
<filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="1000" />
<filter class="solr.LowerCaseFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
<filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
</analyzer>
<analyzer type="query">
<filter class="solr.TrimFilterFactory"/>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
</analyzer>
</fieldType>
Exemplo : Parainquerir "peça". Estou me movimentando780 NumFound(Número de documentos). eu precisoreduzir isso conta, mas comnúmero mais provável de documentos.