Resultados de la búsqueda a petición "tm"
Big Text Corpus rompe tm_map
Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...
Busque programáticamente un símbolo de ticker en R
Tengo un campo de datos que contiene nombres de empresas, como company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordy así. El paquetetm.plugin.webmining le permite consultar datos de ...
tm pierde los metadatos al aplicar tm_map
Tengo un problema (pequeño) con la biblioteca tm r. digo que tengo un corpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...
Error de FUN después de ejecutar 'tolower' al hacer wordcloud de Twitter
Intentando crear wordcloud a partir de datos de twitter, pero aparece el siguiente error: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Este error ...
Dictionary () ya no es compatible con el paquete tm. ¿Cómo enmendar el código?
Acabo de notar que después de actualizar atm v. 0.5-10 la funciónDictionary() ya no es compatible. ¿Es esto un error? ¿O fue desaprobado? ¿Se supone que debo usar otra función para crear un diccionario? Como tengo muchas líneas de código para ...
eliminar duplicados de la lista en función de la similitud / relación semántica
R + tm: ¿Cómo elimino la duplicación de elementos en una lista, en función de la similitud semántica?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Mi solución esperada seríac("bank", "ford_suv',"toyota_suv","nissan_suv"). ...
Cómo calcular la proximidad de palabras a un término específico en un documento
Estoy tratando de encontrar una manera de calcular las proximidades de palabras a un término específico en un documento, así como la proximidad promedio (por palabra). Sé que hay preguntas similares sobre SO, pero nada que me dé la respuesta que ...
Minería de texto con el paquete tm - palabra derivada
Estoy haciendo un poco de minería de texto en R con el
Crear N-Grams con tm y RWeka: funciona con VCorpus pero no con Corpus
Seguir las muchas guías para crearbiGramsusando los paquetes 'tm' y 'RWeka', me frustraba que solo1-gramosestaban siendo devueltos en eltdm. A través de muchas pruebas y errores descubrí que la función adecuada se logró usando 'VCorpus'pero no ...