Resultados de la búsqueda a petición "nlp"

1 la respuesta

¿Cómo unir enteros en NLTK CFG?

Si quiero definir una gramática en la que una de las fichas coincida con un número entero, ¿cómo puedo lograrlo usando la cadena CFG de nltk? Por ejemplo - S -> SK SO FK SK -> 'SELECT' SO -> '\d+' FK -> 'FROM'

1 la respuesta

¿Cómo manejar palabras de argot y formas cortas en Tweets como luv, kool y brb?

Estoy haciendo un preprocesamiento de tweets usando Python. Sin embargo, muchas palabras utilizadas son formas cortas de otras palabras como luv, kool, etc. Y también, abreviaturas como brb, ttyl, etc. En este momento, solo puedo pensar en tener ...

1 la respuesta

Python: la solicitud de traducción de Goslate devuelve "503: Servicio no disponible" [cerrado]

Hace unos meses, usé Pythongoslate paquete para traducir un montón de texto francés al inglés. Sin embargo, cuando intenté hacerlo esta mañana, el servicio me devolvió un error: import goslate gs = goslate.Goslate() print gs.translate('hello ...

1 la respuesta

Similitud de oraciones usando WS4J

Quiero usar ws4j para calcular la similitud entre dos oraciones. Estoy usando la demostración en línea de WS4J @Demostración en línea de WS4J [http://ws4jdemo.appspot.com/<br/] Estoy usando las oraciones de ejemplo predeterminadas dadas por ...

1 la respuesta

¿Problemas para obtener las características más informativas con scikit learn?

Estoy intentando obtener las características más informativas de uncorpus textual [http://pastebin.com/3qYc9mfZ]. De esto bien ...

1 la respuesta

Stanford Corenlp, división de oraciones, excepciones de abreviaturas

¿Hay una opción en Stanford Corenlp para especificar abreviaturas? Por ejemplo en la oración:The reason pt. stayed at home was to rest. pt es la abreviatura de paciente y corenlp lo divide incorrectamente en dos oraciones. Me preguntaba cómo ...

1 la respuesta

Python NLTK pos_tag no devuelve la etiqueta correcta de parte del discurso

Teniendo esto: text = word_tokenize("The quick brown fox jumps over the lazy dog")Y corriendo: nltk.pos_tag(text)Yo obtengo: [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ...

1 la respuesta

Guarde y reutilice TfidfVectorizer en scikit learn

Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...

1 la respuesta

¿NLTK tiene una herramienta para el análisis de dependencias?

Estoy creando una aplicación de PNL y he estado usando el Stanford Parser para la mayoría de mi trabajo de análisis, pero me gustaría comenzar a usar Python. Hasta ahora, NLTK parece ser la mejor apuesta, pero no puedo entender cómo analizar las ...

1 la respuesta

todas las terminaciones de formas de palabras posibles de la raíz de una palabra (biomédica)

Estoy familiarizado con la derivación de palabras y la finalización del paquete tm en R. Estoy tratando de encontrar un método rápido y sucio para encontrar todas las variantes de una palabra dada (dentro de algún corpus). Por ejemplo, me ...