Selenium-Server-Standalone mit R verbinden

Wie in der Post beziehenZugriff auf die Selenium-API in R auf dieser website kann ich einen webdriver erstellen. Es ist mir jedoch nicht möglich, die Elementdetails so abzurufen, wie es Python kann. Darf ich wissen, wie es geht?

Ich möchte den Fußballspieltisch jeder einzelnen Runde abkratzen ...

# using R
library(RCurl)
library(RJSONIO)
library(XML)

# running selenium
system("java -jar selenium-server-standalone-2.35.0.jar")
baseURL<-"http://localhost:4444/wd/hub/"
server<-list(desiredCapabilities=list(browserName='firefox',javascriptEnabled=TRUE))

getURL(paste0(baseURL,"session"),
       customrequest="POST",
       httpheader=c('Content-Type'='application/json;charset=UTF-8'),
       postfields=toJSON(server))

serverDetails<-fromJSON(rawToChar(getURLContent('http://localhost:4444/wd/hub/sessions',binary=TRUE)))
serverId<-serverDetails$value[[1]]$id

# navigate to 7m.cn
URL = "http://data2.7m.cn/history_Matches_Data/2009-2010/92/en/index.shtml"
getURL(paste0(baseURL,"session/",serverId,"/url"),
       customrequest="POST",
       httpheader=c('Content-Type'='application/json;charset=UTF-8'),
       postfields=toJSON(list(url=URL)))

Im Folgenden finden Sie Codes in Python, mit denen Sie die HTML-Elementdetails von 7m.cn abrufen können. Außerdem, eine bessere Idee, um vorzuschlagen? Vielen Dank.

# using Python
import codecs
import lxml.html as lh
from selenium import webdriver

URL = 'http://data2.7m.cn/history_Matches_Data/2009-2010/92/en/index.shtml'
browser = webdriver.Firefox()
browser.get(URL)
content = browser.page_source
browser.quit()

Antworten auf die Frage(1)

Ihre Antwort auf die Frage