Resultados de la búsqueda a petición "nlp"

3 la respuesta

¿Cómo usar OpenNLP para obtener etiquetas POS en R?

Aquí está el código R: library(NLP) library(openNLP) tagPOS <- function(x, ...) { s <- as.String(x) word_token_annotator <- Maxent_Word_Token_Annotator() a2 <- Annotation(1L, "sentence", 1L, nchar(s)) a2 <- annotate(s, word_token_annotator, a2) ...

3 la respuesta

Clasificación de documentos en categorías

Tengo alrededor de 300k documentos almacenados en una base de datos de Postgres que están etiquetados con categorías de temas (hay alrededor de 150 categorías en total). Tengo otros 150k documentos que aún no tienen categorías. Estoy tratando de ...

4 la respuesta

¿Cómo etiquetar automáticamente un grupo de palabras usando semántica?

El contexto es: ya tengo grupos de palabras (frases en realidad) que resultan de kmeans aplicados a consultas de búsqueda en Internet y que usan URL comunes en los resultados del motor de búsqueda como una distancia (coincidencia de URL en lugar ...

2 la respuesta

¿Cómo calculo la distancia de ruta más corta (geodésica) entre dos adjetivos en WordNet usando Python NLTK?

Calcular la similitud semántica entre dos synsets en WordNet se puede hacer fácilmente con varias medidas de similitud incorporadas, como: synset1.path_similarity(synset2)synset1.lch_similarity(synset2), Leacock-Chodorow ...

3 la respuesta

Coseno Similitud de vectores de diferentes longitudes?

Estoy tratando de usar TF-IDF [https://stackoverflow.com/questions/3113428/classifying-documents-into-categories/3114191#3114191] para ordenar documentos en categorías. He calculado el tf_idf para algunos documentos, pero ahora, cuando trato de ...

1 la respuesta

¿NLTK tiene una herramienta para el análisis de dependencias?

Estoy creando una aplicación de PNL y he estado usando el Stanford Parser para la mayoría de mi trabajo de análisis, pero me gustaría comenzar a usar Python. Hasta ahora, NLTK parece ser la mejor apuesta, pero no puedo entender cómo analizar las ...

4 la respuesta

¿Cómo calcular la precisión, el recuerdo, la precisión y la puntuación f1 para el caso multiclase con scikit learn?

Estoy trabajando en un problema de análisis de sentimientos, los datos se ven así: label instances 5 1190 4 838 3 239 1 204 2 127Entonces mis datos están desequilibrados desde 1190instances están etiquetados con5. Para la clasificación estoy ...

1 la respuesta

todas las terminaciones de formas de palabras posibles de la raíz de una palabra (biomédica)

Estoy familiarizado con la derivación de palabras y la finalización del paquete tm en R. Estoy tratando de encontrar un método rápido y sucio para encontrar todas las variantes de una palabra dada (dentro de algún corpus). Por ejemplo, me ...

3 la respuesta

NLTK y detección de idioma

¿Cómo detecto en qué idioma está escrito un texto usando NLTK? Los ejemplos que he visto usarnltk.detect, pero cuando lo instalé en mi Mac, no puedo encontrar este paquete.

6 la respuesta

Reconocimiento de entidad con nombre NLTK a una lista de Python

Usé NLTK'sne_chunk para extraer entidades nombradas de un texto: my_sent = "WASHINGTON -- In the wake of a string of abuses by New York police officers in the 1990s, Loretta E. Lynch, the top federal prosecutor in Brooklyn, spoke forcefully ...