Paquete de agilidad HTML. Cargar y raspar página web
Es este elmejor ¿Cómo obtener una página web al raspar?
<code>HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse(); var doc = new HtmlAgilityPack.HtmlDocument(); doc.Load(resp.GetResponseStream()); var element = doc.GetElementbyId("//start-left"); var element2 = doc.DocumentNode.SelectSingleNode("//body"); string html = doc.DocumentNode.OuterHtml; </code>
He vistoHtmlWeb().Load
para obtener una página web. ¿Es esa una mejor alternativa para cargar y raspar la página web?
Ok, lo intentaré en su lugar.
<code>HtmlDocument doc = web.Load(url); </code>
Ahora cuando tengo midoc
y no obtuve tan propiedades de mutch. A nadie le gustaSelectSingleNode
. El único que puedo usar esGetElementById
, y eso funciona pero quiero obtener una clase.
¿Necesito hacerlo así?
<code>var htmlBody = doc.DocumentNode.SelectSingleNode("//body"); htmlBody.SelectSingleNode("//paging"); </code>