в тупик о том, как очистить данные с этого сайта (используя R)
Я пытаюсь очистить данные, используя R, с этого сайта:http://www.soccer24.com/kosovo/superliga/results/#
Я могу сделать следующее:
library(rvest)
doc <- html("http://www.soccer24.com/kosovo/superliga/results/")
но я в тупик о том, как получить данные. Это потому, что реальные данные на сайте, похоже, генерируются Javascript. Что я могу сделать, это
html_text(doc)
но это дает длинное размытие странного текста (который включает в себя данные, но перемежается с нечетным кодом, и не совсем понятно, как бы я это проанализировал).
То, что я хочу извлечь, это данные о матчах (дата, время, команды, результат) для всех матчей. Никаких других данных с этого сайта не требуется.
Кто-нибудь может дать несколько советов о том, как извлечь эти данные с этого сайта?