Obtendo documentos mais prováveis da consulta usando filtro fonético no solr

Question

Dec 15, 2014, 01:39 PM

n-gram solr error-correction phonetics search-suggestion

Obtendo documentos mais prováveis da consulta usando filtro fonético no solr

estou usandosolr paraverificação ortográfica / correção de consultas. Eu adicioneisolr.PhoneticFilterFactory esolr.NGramFilterFactory em fieldType para executarverificação ortográfica. Isto étrabalhando bem mas aqui oproblema é que eu souobtendo número de documentos da consulta. Eu só precisopalavras / documentos mais prováveis ou em palavras semelhantes, podemos dizer quepalavras / documentos mais próximos aoinquerir.

Snippet deschema.xml :

<fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100">
       <analyzer type="index">         
        <filter class="solr.TrimFilterFactory"/>        
        <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="1000" />
        <filter class="solr.LowerCaseFilterFactory"/>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>        
        <filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <filter class="solr.TrimFilterFactory"/>
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>        
        <filter class="solr.LowerCaseFilterFactory"/>       
        <filter class="solr.PhoneticFilterFactory" encoder="DoubleMetaphone" inject="true"/>
    </analyzer>
</fieldType>

Exemplo : Parainquerir "peça". Estou me movimentando780 NumFound(Número de documentos). eu precisoreduzir isso conta, mas comnúmero mais provável de documentos.