usando scrapy para raspar o site asp.net com botões javascript e solicitações ajax
Eu estava tentando raspar um encontro com o site asp.net, a página inicial deve ser a seguinte:http://www.e3050.com/Items.aspx?cat=SON
Primeiro, quero exibir 50 itens por página (do elemento de seleção) Segundo, quero paginar pelas páginas.
Eu tentei o seguinte código para 50 itens por página, mas não funcionou:
<code>start_urls = ["http://www.e3050.com/Items.aspx?cat=SON"] def parse(self, response): requests = [] hxs = HtmlXPathSelector(response) # Check if there's more than 1 page if len(hxs.select('//span[@id="ctl00_ctl00_ContentPlaceHolder1_ItemListPlaceHolder_lbl_PageSize"]/text()').extract()) > 0: # Get last page number last_page = hxs.select('//span[@id="ctl00_ctl00_ContentPlaceHolder1_ItemListPlaceHolder_lbl_PageSize"]/text()').extract()[0] i = 1 # preparing requests for each page while i < (int(last_page) / 5) + 1: requests.append(Request("http://www.e3050.com/Items.aspx?cat=SON", callback=self.parse_product)) i +=1 # posting form date (50 items and next page button) requests.append(FormRequest.from_response( response, formdata={'ctl00$ctl00$ContentPlaceHolder1$ItemListPlaceHolder$pagesddl':'50', '__EVENTTARGET':'ctl00$ctl00$ContentPlaceHolder1$ItemListPlaceHolder$pager1$ctl00$ctl01'}, callback=self.parse_product, dont_click=True ) ) for request in requests: yield request </code>