O loop R com html_nodes (rvest) não está capturando todos os dados
Eu gostaria de fazer um loop com html_node para pegar algum valor dos nós (nós sem texto), ou seja, eu tenho alguns valores
library(rvest)
country <- c("Canada", "US", "Japan", "China")
Com esses valores ("Canadá", "nos", ...), criei um loop que cria uma URL colando cada valor com "https://en.wikipedia.org/wiki/", depois disso, a cada novo html, aplique read_html (i) e uma sequência de códigos para capturar finalmente um nó com html_nodes ('a.page-link') -sim! um nó, não um texto- e salve esse html_nodes ( ...) como caractere em um quadro de dados (ou pode ser uma lista).
dff<- NULL
for ( i in country ) {
url<-paste0("https://en.wikipedia.org/wiki/",i)
page<- read_html(url)
b <- page%>%
html_nodes ('h2.flow-title') %>%
html_nodes ('a.page-link') %>%
as.character()
dff<- data.frame(b)
}
O problema é que esse código salva apenas os dados do último país, ou seja, executa o primeiro país e obtém os html_nodes (salvando-o), mas quando executa o próximo país, os primeiros dados são apagados e substituídos por esse novo e assim por diante , obtendo como resultado final apenas os dados do último país. Ficaria muito grato com a sua ajuda!