Em R XML Package, qual é a diferença entre xmlParse e xmlTreeParse?
Quando eu iria querer usar oxmlParse
função versus oxmlTreeParse
função? Além disso, quando são valores de parâmetrosuseInternalNodes=TRUE
ouasText=TRUE
útil?
Por exemplo:
library("XML")
nct_url <- "http://clinicaltrials.gov/ct2/show/NCT00112281?resultsxml=true"
xml_doc <- xmlParse(nct_url, useInternalNodes=TRUE)
vs.
doc <- xmlTreeParse(getURL(nct_url), useInternalNodes=TRUE)
top <- xmlRoot(doc)
top[["keyword"]]
xmlValue(top[["start_date"]])
xmlValue(top[["location"]])
As pessoas parecem usar oxmlTreeParse
função para obter um nó não repetitivo via $ doc $ children $ ... traversal. Mas não tenho certeza se entendo quando cada abordagem é melhor. A análise de XML é uma das razões para quase abandonar R e aprender Python. Falta de exemplos for-dummies sem ser forçado a comprar um livro.