mineração de texto com o pacote tm em R, remova as palavras que começam com [http] ou qualquer outra palavra específica
Eu sou novo em R e mineração de texto. Eu criara uma nuvem de palavras a partir do feed do twitter relacionada a algum termo. O problema que estou enfrentando é que, no wordcloud, ele mostra http: ... ou htt ... Como lido com esse problema, tentei usar o metacaractere *, mas ainda duvido que esteja aplicando corretamente
tw.text = removeWords (tw.text, c (palavras-chave ("en"), "rt", "http \\ *"))
alguém em mineração de texto, por favor me ajude com isso.