Resultados de la búsqueda a petición "nltk"

4 la respuesta

NLTK y Stopwords fallan #lookuperror

Estoy tratando de comenzar un proyecto de análisis de sentimientos y utilizaré el método de palabras de detención. Investigué un poco y descubrí que nltk tiene palabras vacías, pero cuando ejecuto el comando hay un error. Lo que hago es lo ...

4 la respuesta

¿Por qué el clasificador NLTK NaiveBayes clasificó erróneamente un registro?

Esta es la primera vez que estoy construyendo un modelo de aprendizaje automático de análisis de sentimientos utilizando el nltk NaiveBayesClassifier en Python. Sé que es un modelo demasiado simple, pero es solo un primer paso para mí e intentaré ...

3 la respuesta

¿Cómo obtener las características más informativas para el clasificador scikit-learn para diferentes clases?

El paquete NLTK proporciona un métodoshow_most_informative_features() para encontrar las características más importantes para ambas clases, con resultados como: contains(outstanding) = True pos : neg = 11.1 : 1.0 contains(seagal) = True neg : ...

1 la respuesta

Cómo analizar oraciones basadas en contenido léxico (frases) con Python-NLTK

¿Puede Python-NLTK reconocer la cadena de entrada y analizarla no solo en función del espacio en blanco sino también del contenido? Digamos, "sistema informático" se convirtió en una frase en esta situación. ¿Alguien puede proporcionar un código ...

1 la respuesta

Nltk stanford pos tagger error: error del comando Java

Estoy tratando de usarnltk.tag.stanford module [http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford]para etiquetar una oración (primero como el ejemplo de wiki) pero sigo recibiendo el siguiente error: Traceback (most recent call ...

2 la respuesta

Python nltk.sent_tokenize error códec ASCII no puede decodificar

Pude leer con éxito el texto en una variable, pero al intentar simular los textos obtengo este extraño error: sentences=nltk.sent_tokenize(sample) UnicodeDecodeError: 'ascii' codec can't decode byte 0xe2 in position 11: ordinal not in ...

1 la respuesta

Preparación de datos y selección de características para entidad nombrada usando SVM

Tengo algunos datos de comentarios de usuarios de los cuales quiero encontrar el nombre de las marcas de electrónica de consumo. Por ejemplo, considere estas oraciones de ejemplo ne_chinked que hablan de "PS4", "nokia 720 lumia", "apple ipad", ...

1 la respuesta

Cálculo de tf-idf entre documentos usando python 2.7

Tengo un escenario en el que recuperé información / datos sin procesar de Internet y los coloqué en sus respectivos archivos json o .txt. A partir de ahí, me gustaría calcular las frecuencias de cada término en cada documento y su similitud de ...

1 la respuesta

Simplificación del conjunto de etiquetas POS francesas con NLTK

¿Cómo se puede simplificar la parte de las etiquetas de voz devueltas por el etiquetador POS francés de Stanford? Es bastante fácil leer una oración en inglés en NLTK, encontrar la parte del discurso de cada palabra, luego usar map_tag () para ...

2 la respuesta

error al instalar paquetes de soporte nltk: nltk.download ()

He instalado el paquete nltk. Después de eso, estoy tratando de descargar los paquetes de soporte usando nltk.download () y obtengo un error: [Errno 11001] getaddrinfo Los detalles de mi máquina / software son: SO: Windows 8.1 Python: 3.3.4 ...