Html Agility Pack. Załaduj i zeskrobuj stronę internetową
Czy to jestNajlepiej sposób na zdobycie strony podczas skrobania?
<code>HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse(); var doc = new HtmlAgilityPack.HtmlDocument(); doc.Load(resp.GetResponseStream()); var element = doc.GetElementbyId("//start-left"); var element2 = doc.DocumentNode.SelectSingleNode("//body"); string html = doc.DocumentNode.OuterHtml; </code>
widziałemHtmlWeb().Load
aby uzyskać stronę internetową. Czy to lepsza alternatywa do załadowania i zeskrobania strony?
Ok, zamiast tego spróbuję.
<code>HtmlDocument doc = web.Load(url); </code>
Teraz, kiedy mam mojedoc
i nie dostałem tak nijakich właściwości. Nikt nie lubiSelectSingleNode
. Jedynym, którego mogę użyć, jestGetElementById
i to działa, ale ja chcę zdobyć klasę.
Czy muszę to robić w ten sposób?
<code>var htmlBody = doc.DocumentNode.SelectSingleNode("//body"); htmlBody.SelectSingleNode("//paging"); </code>