Resultados de la búsqueda a petición "nltk"

4 la respuesta

¿Cómo etiquetar automáticamente un grupo de palabras usando semántica?

El contexto es: ya tengo grupos de palabras (frases en realidad) que resultan de kmeans aplicados a consultas de búsqueda en Internet y que usan URL comunes en los resultados del motor de búsqueda como una distancia (coincidencia de URL en lugar ...

3 la respuesta

Coseno Similitud de vectores de diferentes longitudes?

Estoy tratando de usar TF-IDF [https://stackoverflow.com/questions/3113428/classifying-documents-into-categories/3114191#3114191] para ordenar documentos en categorías. He calculado el tf_idf para algunos documentos, pero ahora, cuando trato de ...

2 la respuesta

¿Cómo calculo la distancia de ruta más corta (geodésica) entre dos adjetivos en WordNet usando Python NLTK?

Calcular la similitud semántica entre dos synsets en WordNet se puede hacer fácilmente con varias medidas de similitud incorporadas, como: synset1.path_similarity(synset2)synset1.lch_similarity(synset2), Leacock-Chodorow ...

1 la respuesta

¿NLTK tiene una herramienta para el análisis de dependencias?

Estoy creando una aplicación de PNL y he estado usando el Stanford Parser para la mayoría de mi trabajo de análisis, pero me gustaría comenzar a usar Python. Hasta ahora, NLTK parece ser la mejor apuesta, pero no puedo entender cómo analizar las ...

2 la respuesta

obtener índices del texto original de nltk word_tokenize

Estoy tokenizando un texto usando nltk.word_tokenize y me gustaría también obtener el índice en el texto original sin procesar para el primer carácter de cada token, es decir. import nltk x = 'hello world' tokens = nltk.word_tokenize(x) >>> ...

3 la respuesta

NLTK y detección de idioma

¿Cómo detecto en qué idioma está escrito un texto usando NLTK? Los ejemplos que he visto usarnltk.detect, pero cuando lo instalé en mi Mac, no puedo encontrar este paquete.

6 la respuesta

Reconocimiento de entidad con nombre NLTK a una lista de Python

Usé NLTK'sne_chunk para extraer entidades nombradas de un texto: my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in Brooklyn, spoke forcefully ...

6 la respuesta

Generación de Ngrams (Unigrams, Bigrams, etc.) a partir de un gran corpus de archivos .txt y su Frecuencia

Necesito escribir un programa en NLTK que rompa un corpus (una gran colección de archivos txt) en unigramas, bigrams, trigrams, fourgrams y fivegrams. Ya he escrito código para ingresar mis archivos en el programa. La entrada es de 300 archivos ...

1 la respuesta

Identificación de la estructura de la oración - espacioso

Tengo la intención de identificar la estructura de la oración en inglés usando spacy y textacy. Por ejemplo: El gato se sentó en el tapete - SVO, El gato saltó y recogió la galleta - SVV0. El gato se comió la galleta y las galletas. - SVOO. Se ...

2 la respuesta

Encontrar la cabeza de una frase sustantiva en NLTK y Stanford analizan según las reglas de encontrar la cabeza de un NP

generalmente Una cabeza de una frase nominal es un sustantivo que está más a la derecha del NP como se muestra debajo del árbol es la cabeza del NP padre. Entonces ROOT | S ___|________________________ NP | ___|_____________ | | PP VP ...