Html Agility Pack. Laden und scrappen Sie die Webseite

Ist das derBeste Weg, um eine Webseite beim Scrapen zu bekommen?

<code>HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse();

var doc = new HtmlAgilityPack.HtmlDocument();

doc.Load(resp.GetResponseStream());
var element = doc.GetElementbyId("//start-left");
var element2 = doc.DocumentNode.SelectSingleNode("//body");
string html = doc.DocumentNode.OuterHtml;
</code>

Ich habe gesehenHtmlWeb().Load um eine Webseite zu bekommen. Ist das eine bessere Alternative, um die Webseite zu laden und zu kratzen?

Ok, ich werde das stattdessen versuchen.

<code>HtmlDocument doc = web.Load(url);
</code>

Nun, als ich meine bekamdoc und nicht so mutch Eigenschaften bekommen. Niemand magSelectSingleNode. Das einzige was ich benutzen kann istGetElementById, und das funktioniert, aber ich möchte eine Klasse bekommen.

Muss ich das so machen?

<code>var htmlBody = doc.DocumentNode.SelectSingleNode("//body");
htmlBody.SelectSingleNode("//paging");
</code>

Antworten auf die Frage(1)

Ihre Antwort auf die Frage