Wyniki wyszukiwania dla "web-scraping"
Czy to możliwe, że Scrapy pobiera bezpośrednio zwykły tekst z surowych danych HTML zamiast używania selektorów xPath?
Na przykład scrapy shell http://scrapy.org/ content = hxs.select('//*[@id="content"]').extract()[0] print content otrzymałem następujące nieprzetworzone kody HTML: <div id="content"> <h2>Welcome to Scrapy</h2> <h3>What is Scrapy?</h3> ...