Проходя через HTML DOM в Python
Я хочу написать скрипт Python (с использованием 3.4.3), который захватывает HTML-страницу с URL и может пройти через DOM, чтобы попытаться найти определенный элемент.
В настоящее время у меня есть это:
#!/usr/bin/env python
import urllib.request
def getSite(url):
return urllib.request.urlopen(url)
if __name__ == '__main__':
content = getSite('http://www.google.com').read()
print(content)
Когда я печатаю контент, он распечатывает всю html-страницу, что близко к тому, что я хочу ... хотя в идеале я хотел бы иметь возможность перемещаться по DOM, а не рассматривать ее как гигантскую строку.
Я все еще довольно плохо знаком с Python, но у меня есть опыт работы со многими другими языками (в основном, Java, C #, C ++, C, PHP, JS). Я делал что-то подобное с Java раньше, но хотел попробовать это на Python.
Любая помощь приветствуется. Ура!