Resultados de la búsqueda a petición "stop-words"

4 la respuesta

Agregar / eliminar palabras de detención con espacios

¿Cuál es la mejor manera de agregar / eliminar palabras vacías con espacios? estoy usandotoken.is_stop [https://spacy.io/docs/api/token]función y me gustaría hacer algunos cambios personalizados en el conjunto. Estaba mirando la documentación ...

3 la respuesta

Detener palabras y stemmer en java

Estoy pensando en poner un stop en mi programa de similitud y luego un stemmer (ir para los porteros 1 o 2 depende de lo que sea más fácil de implementar) e preguntaba que desde que leí mi texto de los archivos como líneas completas y los ...

5 la respuesta

Eliminación de palabras clave con NLTK

Estoy tratando de procesar un texto ingresado por un usuario eliminando palabras clave que usan el kit de herramientas nltk, pero con palabras eliminadas de ...

2 la respuesta

Uso de herpes zóster y palabras de detención con Elasticsearch y Lucene 4.4

En el índice que estoy construyendo, estoy interesado en ejecutar una consulta y luego (usando facetas) devolver las tejas de esa consulta. Aquí está el analizador que estoy usando en el texto: { "settings": { "analysis": { "analyzer": { ...

8 la respuesta

Cómo eliminar palabras de detención usando nltk o python

Así que tengo un conjunto de datos que me gustaría eliminar las palabras de detención del uso de stopwords.words('english') Estoy luchando por cómo usar esto dentro de mi código para simplemente sacar estas palabras. Ya tengo una lista de las ...

2 la respuesta

Deshágase de las palabras vacías y la puntuación

Estoy luchando con la palabra clave NLTK. Aquí está mi código ... ¿Alguien podría decirme qué pasa? from nltk.corpus import stopwords def removeStopwords( palabras ): return [ word for word in palabras if word not in ...

4 la respuesta

Palabras más utilizadas en texto con php

Encontré el código a continuación en stackoverflow y funciona bien para encontrar las palabras más comunes en una cadena. ¿Pero puedo excluir el contar con palabras comunes como "a, if, you, have, etc"? ¿O tendría que eliminar los elementos ...

4 la respuesta

NLTK y Stopwords fallan #lookuperror

Estoy tratando de comenzar un proyecto de análisis de sentimientos y utilizaré el método de palabras de detención. Investigué un poco y descubrí que nltk tiene palabras vacías, pero cuando ejecuto el comando hay un error. Lo que hago es lo ...

2 la respuesta

Tokenizar, eliminar las palabras de parada usando Lucene con Java

1 la respuesta

¿Puede InnoDB usar un archivo de palabra de parada?

Con la búsqueda de texto completo para MyISAM, sé que puedo especificar un archivo de palabra de parada en my.cnf con lo siguiente: ft_stopword_file = '/etc/stopword.txt'¿Se puede hacer lo mismo con la búsqueda de texto completo para InnoDB? Me ...