Schöne Suppe 4 find_all findet keine Links, die Schöne Suppe 3 findet

Ich habe einen wirklich nervigen Bug bemerkt: BeautifulSoup4 (Paket:bs4) findet oft weniger Tags als die Vorgängerversion (Paket:BeautifulSoup).

Hier ist eine reproduzierbare Instanz dieses Problems:

import requests
import bs4
import BeautifulSoup

r = requests.get('http://wordpress.org/download/release-archive/')
s4 = bs4.BeautifulSoup(r.text)
s3 = BeautifulSoup.BeautifulSoup(r.text)

print 'With BeautifulSoup 4 : {}'.format(len(s4.findAll('a')))
print 'With BeautifulSoup 3 : {}'.format(len(s3.findAll('a')))

Ausgabe:

With BeautifulSoup 4 : 557
With BeautifulSoup 3 : 1701

Der Unterschied ist nicht gering, wie Sie sehen können.

Hier sind die genauen Versionen der Module, falls sich jemand wundert:

In [20]: bs4.__version__
Out[20]: '4.2.1'

In [21]: BeautifulSoup.__version__
Out[21]: '3.2.1'

Antworten auf die Frage(1)

Ihre Antwort auf die Frage