Mit SoupStrainer selektiv analysieren

Question

Oct 23, 2010, 06:34 PM

Mit SoupStrainer selektiv analysieren

Im versucht, eine Liste von Videospieltiteln von einer Einkaufsseite zu analysieren. Da die Artikelliste jedoch alle in einem Tag gespeichert ist.

Die Abschnitt der Dokumentation erklärt angeblich, wie man nur einen Teil des Dokuments analysiert, aber ich kann es nicht herausfinden. mein Code:

from BeautifulSoup import BeautifulSoup
import urllib
import re

url = "Some Shopping Site"
html = urllib.urlopen(url).read()
soup = BeautifulSoup(html)
for a in soup.findAll('a',{'title':re.compile('.+') }):
    print a.string

at present gibt die Zeichenfolge in jedem Tag aus, das eine nicht leere Titelreferenz enthält. es ist aber auch das Priting der Items in der Seitenleiste, die die "Specials" sind. wenn ich nur die produktliste div nehmen kann, töte ich 2 vögel mit einer klappe.

Danke vielmals