Resultados da pesquisa a pedido "stop-words"
como adicionar palavras de parada personalizadas usando lucene em java
Eu estou usando o lucene para remover palavras inglesas do batente mas minha exigência é remova palavras de parada inglesas e palavras de parada feitas sob e...
Como posso adicionar mais idiomas a palavras irrelevantes no NLTK?
Estou usando o NLTK com palavras irrelevantes para detectar o idioma de um documento usando o método descrito por Alejandro Nolla ...
Razão de palavras-chave de texto completo do MySQL
Atualmente, estou tentando desenvolver uma pesquisa básica de texto completo para o meu site e notei que certas palavras como "a respeito" estão listadas como palavras de parada para pesquisas de texto completo do MySQL. Isso não me incomoda ...
O InnoDB pode usar um arquivo de palavras irrelevantes?
Com a pesquisa de texto completo do MyISAM, sei que posso especificar um arquivo de palavras de parada no my.cnf com o seguinte: ft_stopword_file = '/etc/stopword.txt'O mesmo pode ser feito com a pesquisa de texto completo do InnoDB? Eu gostaria ...
Tokenize, remova as palavras de parada usando Lucene com Java
Eu estou tentando tokenize e remover palavras de parada de um arquivo txt com Lucene. Eu tenho isto:
Usando palavras Shingles e Stop com Elasticsearch e Lucene 4.4
No índice que estou criando, estou interessado em executar uma consulta e depois (usando facetas) retornar as telhas dessa consulta. Aqui está o analisador que estou usando no texto: { "settings": { "analysis": { "analyzer": { "shingleAnalyzer": ...
Stopwords e texto completo booleano do MySQL
Estou usando os recursos de texto completo booleano do mysql para pesquisar um conjunto de dados. (CORRESPONDÊNCIA ... CONTRA sintaxe). Estou com um problema em que as palavras-chave que estão na lista de palavras-chave padrão do MySql não estão ...
Livre-se de palavras irrelevantes e pontuação
Estou lutando com a palavra de ordem NLT Aqui está o meu trecho de código ... Alguém poderia me dizer o que há de errado? from nltk.corpus import stopwords def removeStopwords( palabras ): return [ word for word in palabras if word not in ...
Pare palavras e stemmer em java
Estou pensando em colocar palavras de parada no meu programa de similaridade e depois em um substituto (ir para os carregadores 1 ou 2 depende do que é mais fácil de implementar) Fiquei imaginando que, desde que eu li meu texto dos arquivos ...
Falha no NLTK e nas palavras-chave #lookuperror
Estou tentando iniciar um projeto de análise de sentimentos e usarei o método stop words. Fiz algumas pesquisas e descobri que o nltk tem palavras irrelevantes, mas quando executo o comando, ocorre um erro. O que faço é o seguinte, para saber ...
Página 1 do 2