Excluir scraping retweets com twitteR em r
Atualmente, estou raspando tweets com base em determinadas palavras-chave usando a versão 1.0.44 e o pacote twitteR (versão ne). Especificamente, eu uso o seguinte comando:
my_twitter_data <- searchTwitter("#aleppo", n = 40000, lang = "en", since = '2016-12-12', until = "2016-12-13", retryOnRateLimit = 120)
Em uma solicitação de 40 mil tweets sobre #aleppo (que leva algum tempo para ser alcançada devido à limitação da taxa), apenas 5 mil dos resultados serão tweets originais, ou seja,strip_retweets(my_twitter_data, strip_manual=TRUE, strip_mt=TRUE)
retornará uma lista de 5k de comprimento.
Meu problema é que gasto muito do meu limite de taxa e, portanto, tempo em retweets que são irrelevantes para minha análise posterior. Minha pergunta é se existe uma maneira de contornar esse problema no R, então eu gasto apenas meu limite de taxa em tweets originais?