Python lxml XPath problem
Estoy intentando imprimir / guardar el HTML de un determinado elemento desde una página web.
He recuperado el XPath del elemento solicitado de firebug.
Todo lo que deseo es guardar este elemento en un archivo. Parece que no logro hacerlo.
(probé el XPath con y sin un/text()
al final
Agradecería cualquier ayuda o experiencia previa.
10x, David
import urllib2,StringIO
from lxml import etree
url='http://www.tutiempo.net/en/Climate/Londres_Heathrow_Airport/12-2009/37720.htm'
seite = urllib2.urlopen(url)
html = seite.read()
seite.close()
parser = etree.HTMLParser()
tree = etree.parse(StringIO.StringIO(html), parser)
xpath = "/html/body/table/tbody/tr/td[2]/div/table/tbody/tr[6]/td/table/tbody/tr/td[3]/table/tbody/tr[3]/td/table/tbody/tr/td/table/tbody/tr/td/table/tbody/text()"
elem = tree.xpath(xpath)
print elem[0].strip().encode("utf-8")