Excluir scraping retweets com twitteR em r

Question

Dec 15, 2016, 01:24 PM

Excluir scraping retweets com twitteR em r

Atualmente, estou raspando tweets com base em determinadas palavras-chave usando a versão 1.0.44 e o pacote twitteR (versão ne). Especificamente, eu uso o seguinte comando:

 my_twitter_data  <- searchTwitter("#aleppo", n = 40000, lang = "en", since =    '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)

Em uma solicitação de 40 mil tweets sobre #aleppo (que leva algum tempo para ser alcançada devido à limitação da taxa), apenas 5 mil dos resultados serão tweets originais, ou seja,strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE) retornará uma lista de 5k de comprimento.

Meu problema é que gasto muito do meu limite de taxa e, portanto, tempo em retweets que são irrelevantes para minha análise posterior. Minha pergunta é se existe uma maneira de contornar esse problema no R, então eu gasto apenas meu limite de taxa em tweets originais?