Scraping verknüpfte HTML-Webseiten durch Schleifen der Funktion rvest :: follow_link ()
Wie kann ich das @ loopervest::follow_link()
Funktion zum Scrappen verlinkter Webseiten?
Anwendungsfall
Identify allLego Movie BesetzunAllen FolgenLego Movie Darsteller-LinksGrab eine Tabelle für jeden Film (+ Jahr) für alle DarstellerDie erforderlichen Selektoren, die ich benötige, sind unten aufgeführt:
library(rvest)
lego_movie <- html("http://www.imdb.com/title/tt1490017/")
lego_movie <- lego_movie %>%
html_nodes(".itemprop , .character a") %>%
html_text()
# follow cast links
(".itemprop .itemprop")
# grab tables of all movies and dates for each cast member
(".year_column , b a")
Gewünschte Ausgabe:
castMember movie year
Will Arnett Lego 2017
Will Arnett BoJack 2014
Will Arnett Wander 2014
............
Elizabeth Banks Moonbeam 2015
Elizabeth Banks Wet Hot 2015
............
Alison Brie Get Hard 2015
Alison Brie GetaJob 2015
.....etc.....