Resultados de la búsqueda a petición "tm"

1 la respuesta

Big Text Corpus rompe tm_map

Me he estado rompiendo la cabeza por esto en los últimos días. Busqué en todos los archivos SO y probé las soluciones sugeridas, pero parece que no puedo hacer que esto funcione. Tengo conjuntos de documentos txt en carpetas como 2000 06, 1995 ...

1 la respuesta

Busque programáticamente un símbolo de ticker en R

Tengo un campo de datos que contiene nombres de empresas, como company <- c("Microsoft", "Apple", "Cloudera", "Ford") > company Company 1 Microsoft 2 Apple 3 Cloudera 4 Fordy así. El paquetetm.plugin.webmining le permite consultar datos de ...

1 la respuesta

tm pierde los metadatos al aplicar tm_map

Tengo un problema (pequeño) con la biblioteca tm r. digo que tengo un corpus: # boilerplate bcorp <- c("one","two","three","four","five") myCorpus <- Corpus(VectorSource(bcorp), list(lanuage = "en_US")) tdm <- TermDocumentMatrix(myCorpus) ...

7 la respuesta

Error de FUN después de ejecutar 'tolower' al hacer wordcloud de Twitter

Intentando crear wordcloud a partir de datos de twitter, pero aparece el siguiente error: Error in FUN(X[[72L]], ...) : invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'Este error ...

3 la respuesta

Dictionary () ya no es compatible con el paquete tm. ¿Cómo enmendar el código?

Acabo de notar que después de actualizar atm v. 0.5-10 la funciónDictionary() ya no es compatible. ¿Es esto un error? ¿O fue desaprobado? ¿Se supone que debo usar otra función para crear un diccionario? Como tengo muchas líneas de código para ...

1 la respuesta

eliminar duplicados de la lista en función de la similitud / relación semántica

R + tm: ¿Cómo elimino la duplicación de elementos en una lista, en función de la similitud semántica?v<-c("bank","banks","banking", "ford_suv',"toyota_suv","nissan_suv"). Mi solución esperada seríac("bank", "ford_suv',"toyota_suv","nissan_suv"). ...

2 la respuesta

Cómo calcular la proximidad de palabras a un término específico en un documento

Estoy tratando de encontrar una manera de calcular las proximidades de palabras a un término específico en un documento, así como la proximidad promedio (por palabra). Sé que hay preguntas similares sobre SO, pero nada que me dé la respuesta que ...

3 la respuesta

¿Cómo puedo configurar manualmente la identificación del documento en un corpus?

2 la respuesta

Minería de texto con el paquete tm - palabra derivada

Estoy haciendo un poco de minería de texto en R con el

1 la respuesta

Crear N-Grams con tm y RWeka: funciona con VCorpus pero no con Corpus

Seguir las muchas guías para crearbiGramsusando los paquetes 'tm' y 'RWeka', me frustraba que solo1-gramosestaban siendo devueltos en eltdm. A través de muchas pruebas y errores descubrí que la función adecuada se logró usando 'VCorpus'pero no ...