Resultados de la búsqueda a petición "stop-words"

4 la respuesta

Agregar / eliminar palabras de detención con espacios

¿Cuál es la mejor manera de agregar / eliminar palabras vacías con espacios? estoy usandotoken.is_stop [https://spacy.io/docs/api/token]función y me gustaría hacer algunos cambios personalizados en el conjunto. Estaba mirando la documentación ...

1 la respuesta

¿Puede InnoDB usar un archivo de palabra de parada?

Con la búsqueda de texto completo para MyISAM, sé que puedo especificar un archivo de palabra de parada en my.cnf con lo siguiente: ft_stopword_file = '/etc/stopword.txt'¿Se puede hacer lo mismo con la búsqueda de texto completo para InnoDB? Me ...

2 la respuesta

Uso de herpes zóster y palabras de detención con Elasticsearch y Lucene 4.4

En el índice que estoy construyendo, estoy interesado en ejecutar una consulta y luego (usando facetas) devolver las tejas de esa consulta. Aquí está el analizador que estoy usando en el texto: { "settings": { "analysis": { "analyzer": { ...

4 la respuesta

NLTK y Stopwords fallan #lookuperror

Estoy tratando de comenzar un proyecto de análisis de sentimientos y utilizaré el método de palabras de detención. Investigué un poco y descubrí que nltk tiene palabras vacías, pero cuando ejecuto el comando hay un error. Lo que hago es lo ...

1 la respuesta

¿Cómo puedo agregar más idiomas a Stopwords en NLTK?

5 la respuesta

Eliminación de palabras clave con NLTK

Estoy tratando de procesar un texto ingresado por un usuario eliminando palabras clave que usan el kit de herramientas nltk, pero con palabras eliminadas de ...

1 la respuesta

cómo agregar palabras de parada personalizadas usando lucene en java

2 la respuesta

Tokenizar, eliminar las palabras de parada usando Lucene con Java

3 la respuesta

Detener palabras y stemmer en java

Estoy pensando en poner un stop en mi programa de similitud y luego un stemmer (ir para los porteros 1 o 2 depende de lo que sea más fácil de implementar) e preguntaba que desde que leí mi texto de los archivos como líneas completas y los ...

2 la respuesta

Deshágase de las palabras vacías y la puntuación

Estoy luchando con la palabra clave NLTK. Aquí está mi código ... ¿Alguien podría decirme qué pasa? from nltk.corpus import stopwords def removeStopwords( palabras ): return [ word for word in palabras if word not in ...