w3.org/TR/html4/struct/links.html#h-12.3.1
то у lxml есть особенность: make_links_absolute:
doc = lxml.html.fromstring(some_html_page)
doc.make_links_absolute(url_for_some_html_page)
и все ссылки в документе сейчас абсолютны. Есть ли простой эквивалент в BeautifulSoup или мне просто нужно пропустить его через urlparse и нормализовать его:
soup = BeautifulSoup(some_html_page)
for tag in soup.findAll('a', href=True):
url_data = urlparse(tag['href'])
if url_data[0] == "":
full_url = url_for_some_html_page + test_url