Html Agility Pack. Laden und scrappen Sie die Webseite
Ist das derBeste Weg, um eine Webseite beim Scrapen zu bekommen?
<code>HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse(); var doc = new HtmlAgilityPack.HtmlDocument(); doc.Load(resp.GetResponseStream()); var element = doc.GetElementbyId("//start-left"); var element2 = doc.DocumentNode.SelectSingleNode("//body"); string html = doc.DocumentNode.OuterHtml; </code>
Ich habe gesehenHtmlWeb().Load
um eine Webseite zu bekommen. Ist das eine bessere Alternative, um die Webseite zu laden und zu kratzen?
Ok, ich werde das stattdessen versuchen.
<code>HtmlDocument doc = web.Load(url); </code>
Nun, als ich meine bekamdoc
und nicht so mutch Eigenschaften bekommen. Niemand magSelectSingleNode
. Das einzige was ich benutzen kann istGetElementById
, und das funktioniert, aber ich möchte eine Klasse bekommen.
Muss ich das so machen?
<code>var htmlBody = doc.DocumentNode.SelectSingleNode("//body"); htmlBody.SelectSingleNode("//paging"); </code>