Resultados da pesquisa a pedido "stemming"
Lista de palavras em russo para SnowballStemmer
Eu sei como executar o SnowballStemmer em uma única palavra (no meu caso, no russo). Fazendo as próximas coisas: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Como posso fazer ...
Convertendo plural para singular em um arquivo de texto com Python
Eu tenho arquivos txt que se parecem com isso: word, 23 Words, 2 test, 1 tests, 4E eu quero que eles sejam assim: word, 23 word, 2 test, 1 test, 4Eu quero ser capaz de pegar um arquivo txt em Python e converter palavras no plural para singular. ...
Analisador padrão com haste
Existe uma maneira de integrarPorterStemFilter para dentroStandardAnalyzer no Lucene, ou eu tenho que copiar / colarStandardAnalyzers código-fonte e adicione o filtro, poisStandardAnalyzer é definido como classe final. Existe alguma maneira mais ...
Qual é o melhor método de stemming no Python?
Eu tentei todos os métodos nltk para stemming, mas isso me deu resultados estranhos com algumas palavras. Exemplos Costuma cortar o final das palavras quando não deve fazê-lo: poodle => poodlartigo artigoou não é muito bom: fácil e fácil não ...
Ocultar alguns plurais com o wordmat lemmatizer não funciona
Oi, eu tenho um problema com o nltk (2.0.4): Estou tentando conter a palavra 'men' ou 'teeth', mas parece que não funciona. Aqui está o meu código: ############################################################################ import nltk from ...
Instalação TreeTagger bem-sucedida, mas não é possível abrir o arquivo .par
Alguém sabe como resolver este erro de leitura de arquivo em
Stemmer esloveno para Sphinx
Estou pesquisando o algoritmo stemming para o idioma esloveno que posso usar com a pesquisa Sphin O que estou tentando obter é, por exemplo, ao pesquisar 'jabolka', também quero resultados para documentos que contenham 'jabolko', 'jabolki', ...
como indexar palavras com seu prefixo em solr?
Uso o solr 3.3 para indexar meus arquivos, quero palavras de índice solr com seus sufixos, por exemplo, quero indexar colorido como cor e, quando procuro, o solr colorido mostra qualquer documento colorid
Palavra base derivada em vez de raiz originada em R
Existe alguma maneira de obter a palavra base em vez da raiz na derivação usando a PNL em Código > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happyness happies happys","sky skies") > > #Creating Corpus ...
Importar WordNet em NLTK
Quero importarwordnet dicionário, mas quando importo o formulário Dicionáriowordnet vejo este erro: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...
Página 1 do 2