Resultados de la búsqueda a petición "nlp"

1 la respuesta

No se puede aplicar el parche LUCENE-2899.patch a SOLR en Windows

Estoy tratando de aplicar el parche LUCENE-2899.patch a Solr. He hecho esto: Solr clonado del repositorio oficial (estoy en la rama maestra)Descargué e instalé un parche de hormiga y GNU, lo consigo ...

1 la respuesta

¿Cómo usar el CountVectorizerand () de sklearn para obtener ngrams que incluyen cualquier puntuación como tokens separados?

yo suelosklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] para calcular n-gramos. Ejemplo: import sklearn.feature_extraction.text # ...

1 la respuesta

PTB treebank de CoNLL-X

Tengo un banco de árboles en formato CoNLL-X y el árbol de análisis binario correspondiente para cada oración y quiero convertirlo a un formato PTB. ¿Hay algún convertidor o alguien puede arrojar luz sobre el formato PTB?

1 la respuesta

De la lista de cadenas, identifique cuáles son nombres humanos y cuáles no

Tengo un vector como el siguiente y me gustaría determinar qué elementos de la lista son nombres humanos y cuáles no. Encontré el paquete humaniformat, que formatea nombres pero desafortunadamente no determina si una cadena es de hecho un nombre. ...

2 la respuesta

¿Hay alguna manera de obtener los datos de texto "originales" para OpenNLP?

Sé que esta pregunta se hizo antes, pero la respuesta no fue satisfactoria (en el sentido de que la respuesta era solo un enlace). Entonces mi pregunta es, ¿hay alguna manera de extender los modelos openNLP existentes? Ya sé sobre la técnica con ...

8 la respuesta

Biblioteca de búsqueda de cadenas fuzzy en Java [cerrado]

Estoy buscando una biblioteca Java de alto rendimiento para la búsqueda de cadenas difusas. Existen numerosos algoritmos para encontrar cadenas similares, distancia de Levenshtein, Daitch-Mokotoff Soundex, n-gramos, etc. ¿Qué implementaciones ...

1 la respuesta

Maltparser dando error en NLTK

Mi código es from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World")Y el error es Traceback (most recent call ...

1 la respuesta

Visualice la estructura de árbol de Parse

Me gustaría mostrar el análisis (etiquetado POS) deopenNLPcomo una visualización de estructura de árbol. A continuación proporciono el árbol de análisis de openNLPpero no puedo trazar como un árbol visual común aAnálisis de ...

3 la respuesta

Crear un nuevo corpus con NLTK

Calculé que a menudo la respuesta a mi título es ir a leer las documentaciones, pero repasé elLibro NLTK [http://www.nltk.org/book]Pero no da la respuesta. Soy un poco nuevo en Python. Tengo un montón de.txt archivos y quiero poder utilizar las ...

2 la respuesta

El método similar del módulo nltk produce resultados diferentes en diferentes máquinas. ¿Por qué?

He enseñado algunas clases introductorias para la minería de texto con Python, y la clase probó el método similar con los textos de práctica proporcionados. Algunos estudiantes obtuvieron resultados diferentes para text1.similar () ...