Resultados de la búsqueda a petición "stemming"

1 la respuesta

SnowballStemmer para la lista de palabras rusas

Sí sé cómo realizar SnowballStemmer en una sola palabra (en mi caso, en ruso). Haciendo lo siguiente: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'¿Cómo puedo hacer ...

3 la respuesta

Convertir plural a singular en un archivo de texto con Python

Tengo archivos txt que se ven así: word, 23 Words, 2 test, 1 tests, 4Y quiero que se vean así: word, 23 word, 2 test, 1 test, 4Quiero poder tomar un archivo txt en Python y convertir palabras en plural a singular. Aquí está mi código: import ...

1 la respuesta

Analizador estándar con stemming

¿Hay alguna manera de integrarse?PorterStemFilter dentroStandardAnalyzer en Lucene, o tengo que copiar / pegarStandardAnalyzers código fuente y agregue el filtro, ya queStandardAnalyzer se define como clase final. ¿Hay alguna forma ...

6 la respuesta

¿Cuál es el mejor método de derivación en Python?

Probé todos los métodos nltk para derivar, pero me dan resultados extraños con algunas palabras. Ejemplos A menudo corta el final de las palabras cuando no debería hacerlo: caniche => poodlartículo articlo no viene muy bien: fácil y ...

2 la respuesta

La instalación de TreeTagger fue exitosa pero no puede abrir el archivo .par

¿Alguien sabe cómo resolver este error de lectura de archivo en

4 la respuesta

Slovenian stemmer para Sphinx

Estoy buscando un algoritmo derivado para el idioma esloveno que pueda usar con la búsqueda Sphinx. Lo que estoy tratando de lograr es, por ejemplo, cuando busco 'jabolka', también quiero resultados para documentos que contienen 'jabolko', ...

1 la respuesta

how indexar palabras con su prefijo en solr?

Uso solr 3.3 para indexar mis archivos, quiero palabras de índice de solr con sus sufijos, por ejemplo, quiero indexar colores como el color y cuando busco solr de color, mostrar cualquier documento que tenga colores.

4 la respuesta

Base de palabras derivadas en lugar de raíz de palabras derivadas en R

¿Hay alguna forma de obtener la palabra base en lugar de la palabra raíz al derivar usando PNL en R? Código > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happyness happies happys","sky skies") > > #Creating Corpus ...

1 la respuesta

Importar WordNet en NLTK

Quiero importarwordnet diccionario pero cuando importo el formulario de diccionariowordnet veo este error: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...

5 la respuesta

Quiero un stemmer árabe de Java

Estoy buscando un stemmer Java para el árabe. Encontré una biblioteca llamada "AraMorph", pero su salida es incontrolable y forma palabras que no son deseadas. ¿Hay alguna otra fuente para el árabe?