Resultados de la búsqueda a petición "nlp"
Modelo de tren usando entidad nombrada
Estoy buscando en el standford corenlp usando el Reconocidor de Entidad Nombrada. Tengo diferentes tipos de texto de entrada y necesito etiquetarlo en mi propia Entidad. Así que comencé a entrenar mi propio modelo y parece que no funciona. Por ...
Similitud de oraciones usando WS4J
Quiero usar ws4j para calcular la similitud entre dos oraciones. Estoy usando la demostración en línea de WS4J @Demostración en línea de WS4J [http://ws4jdemo.appspot.com/<br/] Estoy usando las oraciones de ejemplo predeterminadas dadas por ...
nltk: ¿Cómo lematizar teniendo en contexto las palabras circundantes?
Se imprime el siguiente códigoleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Esto puede o no ser exacto dependiendo del contexto que lo rodea, p.Mary leaves the room vs.Dew drops ...
¿Problemas para obtener las características más informativas con scikit learn?
Estoy intentando obtener las características más informativas de uncorpus textual [http://pastebin.com/3qYc9mfZ]. De esto bien ...
¿Cómo guardar los modelos de alineación Python NLTK para su uso posterior?
En Python, estoy usandoNLTK's alignment module [http://www.nltk.org/api/nltk.align.html]para crear alineaciones de palabras entre textos paralelos. Alinear bitexts puede ser un proceso lento, especialmente cuando se realiza en grandes corpus. ...
Stanford Corenlp, división de oraciones, excepciones de abreviaturas
¿Hay una opción en Stanford Corenlp para especificar abreviaturas? Por ejemplo en la oración:The reason pt. stayed at home was to rest. pt es la abreviatura de paciente y corenlp lo divide incorrectamente en dos oraciones. Me preguntaba cómo ...
Identificar preposiciones y puntos de venta individuales
Estoy tratando de encontrar las partes correctas del discurso para cada palabra en el párrafo. Estoy usando Stanford POS Tagger. Sin embargo, estoy atrapado en un punto. Quiero identificar preposiciones del párrafo. Penn Treebank Tagset dice ...
Extracción de nombre - CV / Currículum - Stanford NER / OpenNLP
Actualmente estoy en un proyecto de aprendizaje para extraer el nombre de una persona de su CV / Currículum. Actualmente estoy trabajando con Stanford-NER y OpenNLP, que tienen un alto grado de éxito desde el primer momento, y tienden a tener ...
Python NLTK pos_tag no devuelve la etiqueta correcta de parte del discurso
Teniendo esto: text = word_tokenize("The quick brown fox jumps over the lazy dog")Y corriendo: nltk.pos_tag(text)Yo obtengo: [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ...
Guarde y reutilice TfidfVectorizer en scikit learn
Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...