Solr Quiso decir (componente de revisión ortográfica)

Question

Feb 29, 2012, 12:12 PM

Solr Quiso decir (componente de revisión ortográfica)

Uso solr para mis aplicaciones y he integrado el componente de corrección ortográfica, pero tengo algunos problemas:

Primero: cuando escribo un término separado por espacio, me dan la corrección para cada término

P.ej : "wat ters" => "qué término" pero la verdad es watters

Segundo: cuando escribo una frase con un término incorrecto. aunque los otros términos son correctos, aplican el hechizo para todos los términos.

P.ej : " Diferencias in lankuage use convenciones "=>" Diferencias en el uso del lenguaje conversiones ".

La verdad es "Diferencias en las convenciones de uso del lenguaje"

Esta es mi configuración en solrconfig.xml :

<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
            <str name="queryAnalyzerFieldType">textSpell</str>
            <lst name="spellchecker">
                <str name="name">default</str>
                <str name="field">spell</str>
                <str name="spellcheckIndexDir">spellchecker</str>
            </lst>
</searchComponent>

<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
            <lst name="defaults">
                <str name="spellcheck.onlyMorePopular">true</str>
                <str name="spellcheck.extendedResults">false</str>
                <str name="spellcheck.count">1</str>
            </lst>
            <arr name="last-components">
                <str>spellcheck</str>
            </arr>
</requestHandler>

Schema.xml:

Tipo de campo

<fieldType name="text" class="solr.TextField" positionIncrementGap="100">
            <analyzer type="index">
                <tokenizer class="solr.StandardTokenizerFactory"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="1" generateNumberParts="1" catenateWords="1" catenateNumbers="1" catenateAll="1" splitOnCaseChange="1"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
                <filter class="solr.SnowballPorterFilterFactory" language="English"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
            </analyzer>
            <analyzer type="query">
                <tokenizer class="solr.StandardTokenizerFactory"/>
                <filter class="solr.LowerCaseFilterFactory"/>
                <filter class="solr.WordDelimiterFilterFactory" generateWordParts="0" generateNumberParts="0" catenateWords="0" catenateNumbers="0" catenateAll="0" splitOnCaseChange="0"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
                <filter class="solr.SnowballPorterFilterFactory" language="English"/>
                <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
            </analyzer>
            <analyzer type="multiterm" >
                <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                <filter class="solr.ASCIIFoldingFilterFactory" />
            </analyzer>
        </fieldType>


    <fieldType name="textSpell" class="solr.TextField" positionIncrementGap="100" omitNorms="true">
                <analyzer type="index">
                   <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                     <filter class="solr.LowerCaseFilterFactory"/>
                     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
                     <filter class="solr.StandardFilterFactory"/>
                     <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
                </analyzer>
                <analyzer type="query">
                     <tokenizer class="solr.WhitespaceTokenizerFactory"/>
                     <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/>
                     <filter class="solr.LowerCaseFilterFactory"/>
                     <!--<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>-->
                     <filter class="solr.StandardFilterFactory"/>
                     <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
                </analyzer>
            </fieldType>

Campos

<field name="title" type="text" indexed="true" stored="true" termVectors="true"/>
<field name="spell" type="textSpell" indexed="true" stored="true" multiValued="true"/>

Copiar campos

<copyField source="title" dest="spell"/>

Apreciaría tu ayud

Salu

Respuestas a la pregunta(2)

Preguntas populares

0 la respuesta

numpy.loadtxt, ValueError: no se pudo convertir la cadena a flotar

0 la respuesta

¿Qué es la versión C ++ de realloc (), para asignar el nuevo búfer y copiar el contenido del anterior?

0 la respuesta

Eliminar etiquetas especificadas en XML (notepad ++)

0 la respuesta

u-boot: reubicación

0 la respuesta

Comprender el manejo de prueba y captura y error

¡Eres muy activo! ¡Es genial!

Solr Quiso decir (componente de revisión ortográfica)

Respuestas a la pregunta(2)

Su respuesta a la pregunta

Preguntas populares