Pacote de Agilidade Html. Carregar e raspar a página da web
É este omelhor maneira de obter uma página quando raspando?
<code>HttpWebRequest oReq = (HttpWebRequest)WebRequest.Create(url); HttpWebResponse resp = (HttpWebResponse)oReq.GetResponse(); var doc = new HtmlAgilityPack.HtmlDocument(); doc.Load(resp.GetResponseStream()); var element = doc.GetElementbyId("//start-left"); var element2 = doc.DocumentNode.SelectSingleNode("//body"); string html = doc.DocumentNode.OuterHtml; </code>
eu tenho vistoHtmlWeb().Load
para obter uma página da web. Essa é uma alternativa melhor para carregar e raspar a página da Web?
Ok, vou tentar isso em vez disso.
<code>HtmlDocument doc = web.Load(url); </code>
Agora, quando eu peguei meudoc
e não consegui propriedades tão mutch. Ninguém gostaSelectSingleNode
. O único que eu posso usar éGetElementById
e isso funciona, mas eu quero fazer uma aula.
Eu preciso fazer isso assim?
<code>var htmlBody = doc.DocumentNode.SelectSingleNode("//body"); htmlBody.SelectSingleNode("//paging"); </code>