W pakiecie R XML jaka jest różnica między xmlParse i xmlTreeParse?
Kiedy chciałbym użyćxmlParse
funkcja axmlTreeParse
funkcjonować? Także kiedy są wartościami parametrówuseInternalNodes=TRUE
lubasText=TRUE
przydatny?
Na przykład:
library("XML")
nct_url <- "http://clinicaltrials.gov/ct2/show/NCT00112281?resultsxml=true"
xml_doc <- xmlParse(nct_url, useInternalNodes=TRUE)
vs.
doc <- xmlTreeParse(getURL(nct_url), useInternalNodes=TRUE)
top <- xmlRoot(doc)
top[["keyword"]]
xmlValue(top[["start_date"]])
xmlValue(top[["location"]])
Ludzie wydają się korzystać zxmlTreeParse
funkcja do uzyskiwania nie powtarzającego się węzła za pośrednictwem przechodzenia $ doc $ children $ .... Ale nie jestem pewien, czy rozumiem, kiedy każde podejście jest najlepsze. Przetwarzanie XML jest jednym z powodów, by prawie porzucić R i nauczyć się Pythona. Brak przykładów na manekiny bez konieczności kupowania książki.