Usar rvest para capturar datos devuelve Sin coincidencias
Estoy tratando de obtener algunos resultados electorales del sitio web de politco usando rvest.
http://www.politico.com/2016-election/results/map/president/wisconsin/
No podía extraer todos los datos de la página a la vez, así que opté por un enfoque a nivel de condado. Cada condado tiene un selector de CSS único (por ejemplo, el condado de Adams es: '#countyAdams .results-table'). Así que tomé todos los nombres de los condados de otros lugares y configuré un bucle rápido (sí, sé que los bucles son una mala práctica en R, pero anticipé que este método me llevaría unos 3 minutos).
Agarra la URL
wiscoSixteen <- read_html("http://www.politico.com/2016-election/results/map/president/wisconsin")
Cree un data.frame vacío (y no, no predefiní las columnas)
stateDf <- NULL
Obtenga la lista de condados (esto no está completo, pero para llegar al punto en que se rompe la rutina, no necesitamos los 70 condados)
wiscoCounties <- c("Adams", "Ashland", "Barron", "Bayfield", "Brown", "Buffalo", "Burnett", "Calumet", "Chippewa", "Clark", "Columbia", "Crawford", "Dane", "Dodge", "Door", "Douglas", "Dunn", "Eau Claire", "Florence", "Fond du Lac", "Forest", "Grant", "Green", "Green Lake", "Iowa", "Iron", "Jackson", "Jefferson", "Juneau")
Mi bucle 'for':
for (i in 1:length(wiscoCounties)){
#Pull out the i'th county name and paste it in a string
wiscoResult <- wiscoSixteen %>% html_node(paste("#county"," .results-table", sep=wiscoCounties[i])) %>% html_table()
#add a column for the county name so I can ID later
wiscoResult[,4] <- wiscoCounties[i]
#then rbind
stateDf <- rbind(stateDf, wiscoResult)
}
Cuando pasa por el décimo condado, se detiene y devuelve 'Error: No coincide'.
No puedo encontrar nada único sobre 'Columbia', el 11 ° condado. Perdido por lo que está sucediendo. Estoy seguro de que es algo estúpido, como suele ser el caso. Cualquier ayuda es apreciada.