Resultados de la búsqueda a petición "stemming"
Stemming palabras en inglés con Lucene
Estoy procesando algunos textos en inglés en una aplicación Java, y necesito detenerlos. Por ejemplo, del texto "amenidades / amenidades" necesito obtener "amenit". La función se ve así: String stemTerm(String term){ ... } Encontré el Lucene ...
Quiero un stemmer árabe de Java
Estoy buscando un stemmer Java para el árabe. Encontré una biblioteca llamada "AraMorph", pero su salida es incontrolable y forma palabras que no son deseadas. ¿Hay alguna otra fuente para el árabe?
Stemming: ¿ejemplos de código o proyectos de código abierto?
Stemming es algo que se necesita en los sistemas de etiquetado. Utilizo delicious, y no tengo tiempo para administrar y podar mis etiquetas. Soy un poco más cuidadoso con mi blog, pero no es perfecto. Escribo software para sistemas embebidos que ...
Analizador estándar con stemming
¿Hay alguna manera de integrarse?PorterStemFilter dentroStandardAnalyzer en Lucene, o tengo que copiar / pegarStandardAnalyzers código fuente y agregue el filtro, ya queStandardAnalyzer se define como clase final. ¿Hay alguna forma ...
SnowballStemmer para la lista de palabras rusas
Sí sé cómo realizar SnowballStemmer en una sola palabra (en mi caso, en ruso). Haciendo lo siguiente: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'¿Cómo puedo hacer ...
Importar WordNet en NLTK
Quiero importarwordnet diccionario pero cuando importo el formulario de diccionariowordnet veo este error: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...
how indexar palabras con su prefijo en solr?
Uso solr 3.3 para indexar mis archivos, quiero palabras de índice de solr con sus sufijos, por ejemplo, quiero indexar colores como el color y cuando busco solr de color, mostrar cualquier documento que tenga colores.
Exacta búsqueda de palabras en Solr
Tengo una pregunta que se relaciona estrechamente conesta pregunt [https://stackoverflow.com/questions/6215389/solr-one-word-phrase-search-to-avoid-stemming] . En mi esquema tengo un campo <field name="text" type="textgen" indexed="true" ...
Slovenian stemmer para Sphinx
Estoy buscando un algoritmo derivado para el idioma esloveno que pueda usar con la búsqueda Sphinx. Lo que estoy tratando de lograr es, por ejemplo, cuando busco 'jabolka', también quiero resultados para documentos que contienen 'jabolko', ...
Analizador de hebreo Lucene
¿Alguien sabe si existe?He estado buscando en Google por meses ...Gracias
Página 1 de 2