Resultados de la búsqueda a petición "nlp"

2 la respuesta

Modelo de tren usando entidad nombrada

Estoy buscando en el standford corenlp usando el Reconocidor de Entidad Nombrada. Tengo diferentes tipos de texto de entrada y necesito etiquetarlo en mi propia Entidad. Así que comencé a entrenar mi propio modelo y parece que no funciona. Por ...

1 la respuesta

Similitud de oraciones usando WS4J

Quiero usar ws4j para calcular la similitud entre dos oraciones. Estoy usando la demostración en línea de WS4J @Demostración en línea de WS4J [http://ws4jdemo.appspot.com/<br/] Estoy usando las oraciones de ejemplo predeterminadas dadas por ...

0 la respuesta

nltk: ¿Cómo lematizar teniendo en contexto las palabras circundantes?

Se imprime el siguiente códigoleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Esto puede o no ser exacto dependiendo del contexto que lo rodea, p.Mary leaves the room vs.Dew drops ...

1 la respuesta

¿Problemas para obtener las características más informativas con scikit learn?

Estoy intentando obtener las características más informativas de uncorpus textual [http://pastebin.com/3qYc9mfZ]. De esto bien ...

3 la respuesta

¿Cómo guardar los modelos de alineación Python NLTK para su uso posterior?

En Python, estoy usandoNLTK's alignment module [http://www.nltk.org/api/nltk.align.html]para crear alineaciones de palabras entre textos paralelos. Alinear bitexts puede ser un proceso lento, especialmente cuando se realiza en grandes corpus. ...

1 la respuesta

Stanford Corenlp, división de oraciones, excepciones de abreviaturas

¿Hay una opción en Stanford Corenlp para especificar abreviaturas? Por ejemplo en la oración:The reason pt. stayed at home was to rest. pt es la abreviatura de paciente y corenlp lo divide incorrectamente en dos oraciones. Me preguntaba cómo ...

2 la respuesta

Identificar preposiciones y puntos de venta individuales

Estoy tratando de encontrar las partes correctas del discurso para cada palabra en el párrafo. Estoy usando Stanford POS Tagger. Sin embargo, estoy atrapado en un punto. Quiero identificar preposiciones del párrafo. Penn Treebank Tagset dice ...

2 la respuesta

Extracción de nombre - CV / Currículum - Stanford NER / OpenNLP

Actualmente estoy en un proyecto de aprendizaje para extraer el nombre de una persona de su CV / Currículum. Actualmente estoy trabajando con Stanford-NER y OpenNLP, que tienen un alto grado de éxito desde el primer momento, y tienden a tener ...

1 la respuesta

Python NLTK pos_tag no devuelve la etiqueta correcta de parte del discurso

Teniendo esto: text = word_tokenize("The quick brown fox jumps over the lazy dog")Y corriendo: nltk.pos_tag(text)Yo obtengo: [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ...

1 la respuesta

Guarde y reutilice TfidfVectorizer en scikit learn

Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...