FUN-Fehler nach dem Ausführen von 'tolower', während Twitter wordcloud @ gemacht wi

Versuche, eine Wortwolke aus Twitter-Daten zu erstellen, erhalte jedoch den folgenden Fehler:

Error in FUN(X[[72L]], ...) : 
  invalid input '������������❤������������ "@xxx:bla, bla, bla... http://t.co/56Fb78aTSC"' in 'utf8towcs' 

Dieser Fehler tritt auf, nachdem der Code "mytwittersearch_corpus <- tm_map (mytwittersearch_corpus, tolower)" ausgeführt wurde

mytwittersearch_list <-sapply(mytwittersearch, function(x) x$getText())

mytwittersearch_corpus <-Corpus(VectorSource(mytwittersearch_corpus_list))
mytwittersearch_corpus<-tm_map(mytwittersearch_corpus, tolower)
mytwittersearch_corpus<-tm_map( mytwittersearch_corpus, removePunctuation)
mytwittersearch_corpus <-tm_map(mytwittersearch_corpus, function(x) removeWords(x, stopwords()))

Ich habe auf anderen Seiten gelesen, dass R möglicherweise Probleme mit der Verarbeitung von Symbolen, Emoticons und Buchstaben in anderen Sprachen als Englisch hat. Dies scheint jedoch nicht das Problem mit den "Fehler-Tweets" zu sein, mit denen R Probleme hat. Ich habe die Codes ausgeführt:

mytwittersearch_corpus <- tm_map(mytwittersearch_corpus, function(x) iconv(enc2utf8(x), sub = "byte"))
mytwittersearch_corpus<- tm_map(mytwittersearch_corpus, content_transformer(function(x)    iconv(enc2utf8(x), sub = "bytes")))

Diese helfen nicht. Ich bekomme auch, dass es keine Funktion finden kanncontent_transformer obwohl dietm-package ist abgehakt und läuft.

Ich führe dies unter OS X 10.6.8 aus und verwende das neueste RStudio.

Antworten auf die Frage(14)

Ihre Antwort auf die Frage