Resultados de la búsqueda a petición "lxml"
¿Cómo recuperar XML sin procesar de lxml?
Estoy usando el siguiente código para localizar un div: parser = etree.HTMLParser() tree = etree.parse(StringIO(page), parser) div = tree.xpath("//div[@class='content']")[0]Mi único problema es que, después de hacer esto, no quiero confiar en ...
¿Eliminar todo el HTML en Python?
¿Hay alguna manera de eliminar / escapar etiquetas html usando lxml.html y no beautifulsoup que tiene algunos problemas con xss? Intenté usar el limpiador, pero quiero eliminar todo el HTML.
¿Cómo se puede reescribir esta función para implementar OrderedDict?
Tengo la siguiente función que hace un trabajo tosco de analizar un archivo XML en un diccionario. Desafortunadamente, dado que los diccionarios de Python no están ordenados, no puedo recorrer los nodos como quisiera. ¿Cómo cambio esto para que ...
SSL: verificación de certificado CERTIFICATE_VERIFY_FAILED falló
from lxml import html import requests url = "https://website.com/" page = requests.get(url) tree = html.fromstring(page.content) page.content->Error de SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] falló la verificación del certificado (_ssl.c: ...
¿Cuáles son las diferencias entre lxml y ElementTree?
Cuando se trata degenerar datos XML en Python [https://stackoverflow.com/q/3844360/3357935], hay dos bibliotecas que a menudo veo recomendadas:lxml [http://lxml.de]yElementTree [https://docs.python.org/3/library/xml.etree.elementtree.html] Por ...
Python BeautifulSoup equivalente a lxml make_links_absolute
Entonces lxml tiene una característica muy manual: make_links_absolute: doc = lxml.html.fromstring(some_html_page) doc.make_links_absolute(url_for_some_html_page)y todos los enlaces en doc son absolutos ahora. ¿Hay un equivalente fácil en ...
Generando xml en python y lxml
Tengo este xml de sql, y quiero hacer lo mismo con python 2.7 y lxml <?xml version="1.0" encoding="utf-16"?> <results> <Country name="Germany" Code="DE" Storage="Basic" Status="Fresh" Type="Photo" /> </results>Ahora tengo: from lxml import ...
lxml etree xmlparser eliminar el espacio de nombres no deseado
Tengo un documento xml que estoy tratando de analizar usando Etree.lxml <Envelope xmlns="http://www.example.com/zzz/yyy"> <Header> <Version>1</Version> </Header> <Body> some stuff <Body> <Envelope>Mi código es: path = "path to xml file" from ...
Usando Python y lxml para quitar solo las etiquetas que tienen ciertos atributos / valores
Estoy familiarizado con Etreestrip_tags ystrip_elements métodos, pero estoy buscando una forma sencilla de eliminar etiquetas (y dejar sus contenidos) que solo contengan atributos / valores particulares. Por ejemplo: me gustaría quitar todospan ...