Mit SoupStrainer selektiv analysieren
Im versucht, eine Liste von Videospieltiteln von einer Einkaufsseite zu analysieren. Da die Artikelliste jedoch alle in einem Tag gespeichert ist.
Die Abschnitt der Dokumentation erklärt angeblich, wie man nur einen Teil des Dokuments analysiert, aber ich kann es nicht herausfinden. mein Code:
from BeautifulSoup import BeautifulSoup
import urllib
import re
url = "Some Shopping Site"
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)
for a in soup.findAll('a',{'title':re.compile('.+') }):
print a.string
at present gibt die Zeichenfolge in jedem Tag aus, das eine nicht leere Titelreferenz enthält. es ist aber auch das Priting der Items in der Seitenleiste, die die "Specials" sind. wenn ich nur die produktliste div nehmen kann, töte ich 2 vögel mit einer klappe.
Danke vielmals