Resultados de la búsqueda a petición "nlp"

2 la respuesta

Devuelve una lista de coincidencias por frase dada

Estoy tratando de hacer un método que pueda verificar si una frase dada coincide con al menos un elemento de la lista de frases y las devuelve. La entrada es la frase, una lista de frases y un diccionario de listas de sinónimos. El punto ...

1 la respuesta

Nltk stanford pos tagger error: error del comando Java

Estoy tratando de usarnltk.tag.stanford module [http://www.nltk.org/api/nltk.tag.html#module-nltk.tag.stanford]para etiquetar una oración (primero como el ejemplo de wiki) pero sigo recibiendo el siguiente error: Traceback (most recent call ...

3 la respuesta

División de documentos chinos en oraciones [cerrado]

Tengo que dividir el texto chino en varias oraciones. Probé el Stanford DocumentPreProcessor. Funcionó bastante bien para inglés pero no para chino. Por favor, ¿pueden informarme de cualquier buen divisor de frases para chino, preferiblemente en ...

4 la respuesta

¿Cómo usar Gensim doc2vec con vectores de palabras previamente entrenados?

Recientemente me encontré con la adición de doc2vec a Gensim. ¿Cómo puedo usar vectores de palabras previamente capacitados (por ejemplo, que se encuentran en el sitio web original de word2vec) con doc2vec? ¿O es que doc2vec obtiene los vectores ...

1 la respuesta

Simplificación del conjunto de etiquetas POS francesas con NLTK

¿Cómo se puede simplificar la parte de las etiquetas de voz devueltas por el etiquetador POS francés de Stanford? Es bastante fácil leer una oración en inglés en NLTK, encontrar la parte del discurso de cada palabra, luego usar map_tag () para ...

1 la respuesta

¿Redefiniendo "oración" en Emacs? (espacio simple entre oraciones, pero ignorando las abreviaturas)

Me gustaría poder navegar por oración en Emacs (M-a, M-e). Aquí está el problema: por defecto, Emacs espera que cada oración esté separada por dos espacios, y estoy acostumbrado a poner un solo espacio. Por supuesto, esa configuración se puede ...

5 la respuesta

Python regex: tokenizar las contracciones inglesas

Estoy tratando de analizar cadenas de manera que se separen todos los componentes de palabras, incluso aquellos que se han contratado. Por ejemplo, la tokenización de "shouldn't" sería ["should", "n't"]. Sin embargo, el módulo nltk no parece ...

5 la respuesta

¿Cómo realizar la lematización en R?

Esta pregunta es un posible duplicado deLemmatizer en R o python (am, are, is -> be?) [https://stackoverflow.com/questions/22993796/lemmatizer-in-r-or-python-am-are-is-be] , pero lo agrego nuevamente ya que el anterior se cerró diciendo que ...

1 la respuesta

¿Cómo unir enteros en NLTK CFG?

Si quiero definir una gramática en la que una de las fichas coincida con un número entero, ¿cómo puedo lograrlo usando la cadena CFG de nltk? Por ejemplo - S -> SK SO FK SK -> 'SELECT' SO -> '\d+' FK -> 'FROM'

2 la respuesta

¿Cómo generar fragmentos NLTK en el archivo?

Tengo este script de Python donde estoy usando la biblioteca nltk para analizar, tokenizar, etiquetar y fragmentar algunos, digamos texto aleatorio de la web. Necesito formatear y escribir en un archivo la salida dechunked1,chunked2,chunked3. ...