Resultados de la búsqueda a petición "nltk"
¿Cómo etiquetar automáticamente un grupo de palabras usando semántica?
El contexto es: ya tengo grupos de palabras (frases en realidad) que resultan de kmeans aplicados a consultas de búsqueda en Internet y que usan URL comunes en los resultados del motor de búsqueda como una distancia (coincidencia de URL en lugar ...
Coseno Similitud de vectores de diferentes longitudes?
Estoy tratando de usar TF-IDF [https://stackoverflow.com/questions/3113428/classifying-documents-into-categories/3114191#3114191] para ordenar documentos en categorías. He calculado el tf_idf para algunos documentos, pero ahora, cuando trato de ...
¿Cómo calculo la distancia de ruta más corta (geodésica) entre dos adjetivos en WordNet usando Python NLTK?
Calcular la similitud semántica entre dos synsets en WordNet se puede hacer fácilmente con varias medidas de similitud incorporadas, como: synset1.path_similarity(synset2)synset1.lch_similarity(synset2), Leacock-Chodorow ...
¿NLTK tiene una herramienta para el análisis de dependencias?
Estoy creando una aplicación de PNL y he estado usando el Stanford Parser para la mayoría de mi trabajo de análisis, pero me gustaría comenzar a usar Python. Hasta ahora, NLTK parece ser la mejor apuesta, pero no puedo entender cómo analizar las ...
obtener índices del texto original de nltk word_tokenize
Estoy tokenizando un texto usando nltk.word_tokenize y me gustaría también obtener el índice en el texto original sin procesar para el primer carácter de cada token, es decir. import nltk x = 'hello world' tokens = nltk.word_tokenize(x) >>> ...
NLTK y detección de idioma
¿Cómo detecto en qué idioma está escrito un texto usando NLTK? Los ejemplos que he visto usarnltk.detect, pero cuando lo instalé en mi Mac, no puedo encontrar este paquete.
Reconocimiento de entidad con nombre NLTK a una lista de Python
Usé NLTK'sne_chunk para extraer entidades nombradas de un texto: my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in Brooklyn, spoke forcefully ...
Generación de Ngrams (Unigrams, Bigrams, etc.) a partir de un gran corpus de archivos .txt y su Frecuencia
Necesito escribir un programa en NLTK que rompa un corpus (una gran colección de archivos txt) en unigramas, bigrams, trigrams, fourgrams y fivegrams. Ya he escrito código para ingresar mis archivos en el programa. La entrada es de 300 archivos ...
Identificación de la estructura de la oración - espacioso
Tengo la intención de identificar la estructura de la oración en inglés usando spacy y textacy. Por ejemplo: El gato se sentó en el tapete - SVO, El gato saltó y recogió la galleta - SVV0. El gato se comió la galleta y las galletas. - SVOO. Se ...
Encontrar la cabeza de una frase sustantiva en NLTK y Stanford analizan según las reglas de encontrar la cabeza de un NP
generalmente Una cabeza de una frase nominal es un sustantivo que está más a la derecha del NP como se muestra debajo del árbol es la cabeza del NP padre. Entonces ROOT | S ___|________________________ NP | ___|_____________ | | PP VP ...