Resultados de la búsqueda a petición "nlp"

2 la respuesta

¿Qué significa incrustar una palabra ponderada?

En elpapel [http://www.aclweb.org/anthology/S17-2100]que estoy tratando de implementar, dice: En este trabajo, los tweets se modelaron utilizando tres tipos de representación de texto. El primero es un modelo de bolsa de palabras ponderado por ...

2 la respuesta

Usando word2vec para clasificar palabras en categorías

ANTECEDENTES Tengo vectores con algunos datos de muestra y cada vector tiene un nombre de categoría (Lugares, Colores, Nombres). ['john','jay','dan','nathan','bob'] -> 'Names' ['yellow', 'red','green'] -> 'Colors' ...

1 la respuesta

Usando PhraseMatcher en SpaCy para encontrar múltiples tipos de coincidencias

La documentación y las muestras de SpaCy muestran que la clase PhraseMatcher es útil para unir secuencias de tokens en documentos. Uno debe proporcionar un vocabulario de secuencias que coincidan. En mi solicitud, tengo documentos que son ...

3 la respuesta

Eliminar un verbo como palabra de paso

Hay algunas palabras que se usan a veces como verbo y otras como parte del discurso. Ejemplo Una oración con el significado de la palabra como verbo: I blame myself for what happenedY una oración con el significado de la palabra como ...

4 la respuesta

Preprocesamiento de texto de Keras: guardar el objeto Tokenizer en un archivo para su puntuación

He entrenado un modelo clasificador de sentimientos usando la biblioteca Keras siguiendo los pasos a continuación (en términos generales). Convierta el corpus de texto en secuencias usando el objeto / clase TokenizerConstruya un modelo usando el ...

1 la respuesta

SnowballStemmer para la lista de palabras rusas

Sí sé cómo realizar SnowballStemmer en una sola palabra (en mi caso, en ruso). Haciendo lo siguiente: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'¿Cómo puedo hacer ...

3 la respuesta

¿Cómo hacer preprocesamiento de texto usando spaCy?

Cómo hacer los pasos de preprocesamiento como la eliminación de Stopword, la eliminación de puntuación, la derivación y la lematización en spaCy usando python. Tengo datos de texto en el archivo csv como párrafos y oraciones. Quiero ...

3 la respuesta

Pérdida en tensores enmascarados

Supongamos que tengo logits como [[4.3, -0.5, -2.7, 0, 0], [0.5, 2.3, 0, 0, 0]] donde claramente los dos últimos en el primer ejemplo y los últimos tres en el segundo ejemplo están enmascarados y no deberían afectar los cálculos de pérdida y ...

1 la respuesta

¿Se puede usar el diccionario ANEW para el análisis de sentimientos en quanteda?

Estoy tratando de encontrar una manera de implementar las Normas afectivas para palabras en inglés (en holandés) para un análisis de sentimiento longitudinal con Quanteda. Lo que finalmente quiero tener es un "sentimiento medio" por año para ...

2 la respuesta

Stanford NLP Tagger a través de NLTK - tag_sents divide todo en caracteres

Espero que alguien tenga experiencia con esto, ya que no puedo encontrar ningún comentario en línea además de un informe de error de 2015 con respecto al NERtagger, que probablemente sea el mismo. De todos modos, estoy tratando de procesar el ...