Resultados da pesquisa a pedido "stemming"

1 a resposta

Lista de palavras em russo para SnowballStemmer

Eu sei como executar o SnowballStemmer em uma única palavra (no meu caso, no russo). Fazendo as próximas coisas: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Como posso fazer ...

3 a resposta

Convertendo plural para singular em um arquivo de texto com Python

Eu tenho arquivos txt que se parecem com isso: word, 23 Words, 2 test, 1 tests, 4E eu quero que eles sejam assim: word, 23 word, 2 test, 1 test, 4Eu quero ser capaz de pegar um arquivo txt em Python e converter palavras no plural para singular. ...

1 a resposta

Analisador padrão com haste

Existe uma maneira de integrarPorterStemFilter para dentroStandardAnalyzer no Lucene, ou eu tenho que copiar / colarStandardAnalyzers código-fonte e adicione o filtro, poisStandardAnalyzer é definido como classe final. Existe alguma maneira mais ...

6 a resposta

Qual é o melhor método de stemming no Python?

Eu tentei todos os métodos nltk para stemming, mas isso me deu resultados estranhos com algumas palavras. Exemplos Costuma cortar o final das palavras quando não deve fazê-lo: poodle => poodlartigo artigoou não é muito bom: fácil e fácil não ...

2 a resposta

Ocultar alguns plurais com o wordmat lemmatizer não funciona

Oi, eu tenho um problema com o nltk (2.0.4): Estou tentando conter a palavra 'men' ou 'teeth', mas parece que não funciona. Aqui está o meu código: ############################################################################ import nltk from ...

2 a resposta

Instalação TreeTagger bem-sucedida, mas não é possível abrir o arquivo .par

Alguém sabe como resolver este erro de leitura de arquivo em

2 a resposta

Stemmer esloveno para Sphinx

Estou pesquisando o algoritmo stemming para o idioma esloveno que posso usar com a pesquisa Sphin O que estou tentando obter é, por exemplo, ao pesquisar 'jabolka', também quero resultados para documentos que contenham 'jabolko', 'jabolki', ...

1 a resposta

como indexar palavras com seu prefixo em solr?

Uso o solr 3.3 para indexar meus arquivos, quero palavras de índice solr com seus sufixos, por exemplo, quero indexar colorido como cor e, quando procuro, o solr colorido mostra qualquer documento colorid

4 a resposta

Palavra base derivada em vez de raiz originada em R

Existe alguma maneira de obter a palavra base em vez da raiz na derivação usando a PNL em Código > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happyness happies happys","sky skies") > > #Creating Corpus ...

1 a resposta

Importar WordNet em NLTK

Quero importarwordnet dicionário, mas quando importo o formulário Dicionáriowordnet vejo este erro: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...