Problema no seletor de CSS com estatísticas rvest e NHL
Quero raspar dados do hockey-reference.com, especificamente deste link:
https://www.hockey-reference.com/leagues/NHL_1991.html
Quero a quarta tabela, chamada "Estatísticas da Equipe", e também quero subtrair a primeira e a última linha (mas isso pode ser para outra hora).
Inicialmente, quero que o rascunho funcione com o link de 1991, mas quero raspar todos os links de 1991 a 2017.
library(tidyverse)
library(rvest)
stat_urls <- "https://www.hockey-reference.com/leagues/NHL_1991.html"
No momento, tenho apenas o link de 1991, por simplicidade. Não consigo encontrar a seleção correta de css, apesar de ter tentado várias diferentes, depois de uma pesquisa bastante minuciosa usando a fonte "inspecionar" da página da Web real. Eu tentei as seguintes seleções de css:
table#stats.sortable.stats_table.now.sortable
#stats
#all_stats
#all_stats > div.table_outer_container
#stats
#stats > tbody
#div_stats (and all sorts of combos with this one)
Nenhuma dessas funciona, quando usada no seguinte código:
team_stats <- stat_urls %>%
read_html() %>%
html_nodes("#stats") %>%
html_table(header = T)
Todas as tentativas com "xpath =" também falharam. Qualquer ajuda com isso seria absolutamente fenomenal, e Preds Go!