Resultados de la búsqueda a petición "text-mining"

2 la respuesta

Vectorización de ngram de palabra realmente rápida en R

editar: El nuevo paquete text2vec es excelente y resuelve este problema (y muchos otros) realmente bien. text2vec en CRAN [https://cran.r-project.org/web/packages/text2vec/index.html] text2vec en github [https://github.com/dselivanov/text2vec] ...

2 la respuesta

minería de texto con paquete tm en R, elimine palabras que comiencen desde [http] o cualquier otra palabra específica

Soy nuevo en R y minería de texto. Había creado una nube de palabras en el feed de Twitter relacionado con algún término. El problema al que me enfrento es que en el wordcloud muestra http: ... o htt ... ¿Cómo trato este problema? Intenté usar ...

2 la respuesta

Cómo mantener los marcadores de inicio y fin de oración con quanteda

Estoy tratando de crear 3 gramos usando R'squanteda paquete. Estoy luchando por encontrar una manera de mantener los n-gramos al principio y al final de los marcadores de oración, el<s> y</s> como en el siguiente código. Pensé que usando ...

2 la respuesta

marco de datos de tfidf con python

Tengo que clasificar algunos sentimientos, mi marco de datos es así Phrase Sentiment is it good movie positive wooow is it very goode positive bad movie negativehice un preprocesamiento como tokenización para detener las palabras derivadas, etc. ...

2 la respuesta

Doc2Vec Sentence Clustering

Tengo múltiples documentos que contienen múltiples oraciones. Quiero usardoc2vec agrupar (por ejemplo, k-medias) los vectores de oración usandosklearn. Como tal, la idea es que oraciones similares se agrupan en varios grupos. Sin embargo, no me ...

2 la respuesta

Reconocer tabla PDF usando R

Estoy tratando de extraer datos de tablas dentro de algunos informes en pdf. He visto algunos ejemplos usando pdftools y paquetes similares. Tuve éxito en obtener el texto, sin embargo, solo quiero extraer las tablas. ¿Hay alguna manera de usar ...

2 la respuesta

Error al extraer frases usando Gensim

Estoy tratando de obtener los bigrams en las oraciones usando frases en Gensim de la siguiente manera. from gensim.models import Phrases from gensim.models.phrases import Phraser documents = ["the mayor of new york was there", "machine learning ...

2 la respuesta

Análisis de opinión de C # [cerrado]

¿Alguien sabe de una biblioteca de C # (preferiblemente de código abierto) que se pueda implementar para calcular el sentimiento general de un texto dado?

2 la respuesta

¿Cómo acceder a Wikipedia desde R?

Existe algún paquete para R que permita consultar Wikipedia (muy probablemente utilizando la API de Mediawiki) para obtener una lista de artículos disponibles relevantes para dicha consulta, así como para importar artículos seleccionados para la ...

3 la respuesta

análisis de sentimientos - wordNet, léxico sentiWordNet

Necesito una lista de palabras positivas y negativas con elpesos Asignado a las palabras según la fuerza y ​​la semana. Tengo :1.) WordNet - Da una puntuació...