Error de FUN después de ejecutar 'tolower' al hacer wordcloud de Twitter
Intentando crear wordcloud a partir de datos de twitter, pero aparece el siguiente error:
Error in FUN(X[[72L]], ...) :
invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs'
Este error aparece después de ejecutar el código "mytwittersearch_corpus <- tm_map (mytwittersearch_corpus, tolower)"
mytwittersearch_list <-sapply(mytwittersearch, function(x) x$getText())
mytwittersearch_corpus <-Corpus(VectorSource(mytwittersearch_corpus_list))
mytwittersearch_corpus<-tm_map(mytwittersearch_corpus, tolower)
mytwittersearch_corpus<-tm_map( mytwittersearch_corpus, removePunctuation)
mytwittersearch_corpus <-tm_map(mytwittersearch_corpus, function(x) removeWords(x, stopwords()))
Leí en otras páginas que esto puede deberse a que R tiene dificultades para procesar símbolos, emoticones y letras en idiomas distintos del inglés, pero este no parece ser el problema con los "tweets de error" con los que R tiene problemas. Ejecuté los códigos:
mytwittersearch_corpus <- tm_map(mytwittersearch_corpus, function(x) iconv(enc2utf8(x), sub = "byte"))
mytwittersearch_corpus<- tm_map(mytwittersearch_corpus, content_transformer(function(x) iconv(enc2utf8(x), sub = "bytes")))
Estos no ayudan. También entiendo que no puede encontrar la funcióncontent_transformer
a pesar detm-package
está marcado y en funcionamiento.
Estoy ejecutando esto en OS X 10.6.8 y estoy usando el último RStudio.