Resultados de la búsqueda a petición "nlp"
No se puede aplicar el parche LUCENE-2899.patch a SOLR en Windows
Estoy tratando de aplicar el parche LUCENE-2899.patch a Solr. He hecho esto: Solr clonado del repositorio oficial (estoy en la rama maestra)Descargué e instalé un parche de hormiga y GNU, lo consigo ...
¿Cómo usar el CountVectorizerand () de sklearn para obtener ngrams que incluyen cualquier puntuación como tokens separados?
yo suelosklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] para calcular n-gramos. Ejemplo: import sklearn.feature_extraction.text # ...
PTB treebank de CoNLL-X
Tengo un banco de árboles en formato CoNLL-X y el árbol de análisis binario correspondiente para cada oración y quiero convertirlo a un formato PTB. ¿Hay algún convertidor o alguien puede arrojar luz sobre el formato PTB?
De la lista de cadenas, identifique cuáles son nombres humanos y cuáles no
Tengo un vector como el siguiente y me gustaría determinar qué elementos de la lista son nombres humanos y cuáles no. Encontré el paquete humaniformat, que formatea nombres pero desafortunadamente no determina si una cadena es de hecho un nombre. ...
¿Hay alguna manera de obtener los datos de texto "originales" para OpenNLP?
Sé que esta pregunta se hizo antes, pero la respuesta no fue satisfactoria (en el sentido de que la respuesta era solo un enlace). Entonces mi pregunta es, ¿hay alguna manera de extender los modelos openNLP existentes? Ya sé sobre la técnica con ...
Biblioteca de búsqueda de cadenas fuzzy en Java [cerrado]
Estoy buscando una biblioteca Java de alto rendimiento para la búsqueda de cadenas difusas. Existen numerosos algoritmos para encontrar cadenas similares, distancia de Levenshtein, Daitch-Mokotoff Soundex, n-gramos, etc. ¿Qué implementaciones ...
Maltparser dando error en NLTK
Mi código es from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World")Y el error es Traceback (most recent call ...
Visualice la estructura de árbol de Parse
Me gustaría mostrar el análisis (etiquetado POS) deopenNLPcomo una visualización de estructura de árbol. A continuación proporciono el árbol de análisis de openNLPpero no puedo trazar como un árbol visual común aAnálisis de ...
Crear un nuevo corpus con NLTK
Calculé que a menudo la respuesta a mi título es ir a leer las documentaciones, pero repasé elLibro NLTK [http://www.nltk.org/book]Pero no da la respuesta. Soy un poco nuevo en Python. Tengo un montón de.txt archivos y quiero poder utilizar las ...
El método similar del módulo nltk produce resultados diferentes en diferentes máquinas. ¿Por qué?
He enseñado algunas clases introductorias para la minería de texto con Python, y la clase probó el método similar con los textos de práctica proporcionados. Algunos estudiantes obtuvieron resultados diferentes para text1.similar () ...