Resultados de la búsqueda a petición "lxml"
Preservar el orden de los atributos XML?
Sé que esta pregunta se ha hecho en el pasado, pero todas se han fechado hace unos años. Me pregunto si se han realizado cambios en los módulos de Python como lxml, minidom o etree que nos permitirán preservar el orden de los atributos en los ...
Cómo encontrar hijos directos de element en lxml
Encontré un objeto con clase específica: THREAD = TREE.find_class('thread')[0]Ahora quiero obtener todo<p> elementos que son sus hijos directos. Estoy cansado: THREAD.findall("p") THREAD.xpath("//div[@class='thread']/p")Pero todo eso devuelve ...
¿Cuáles son las diferencias entre lxml y ElementTree?
Cuando se trata degenerar datos XML en Python [https://stackoverflow.com/q/3844360/3357935], hay dos bibliotecas que a menudo veo recomendadas:lxml [http://lxml.de]yElementTree [https://docs.python.org/3/library/xml.etree.elementtree.html] Por ...
SSL: verificación de certificado CERTIFICATE_VERIFY_FAILED falló
from lxml import html import requests url = "https://website.com/" page = requests.get(url) tree = html.fromstring(page.content) page.content->Error de SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] falló la verificación del certificado (_ssl.c: ...
¿No puede escribir correctamente los elementos extraídos en un archivo de Excel?
He escrito un código en Python para analizar el título y el enlace desde una página web. Inicialmente, intenté analizar los enlaces desde la barra lateral izquierda y luego raspar los documentos mencionados de cada página rastreando cada enlace. ...
¿pueden lxml / request seleccionar opciones desplegables y luego analizar ajax resultante?
Tengo un sitio que intento probar y, aunque puedo obtener una lista de opciones en un menú desplegable, no estoy seguro de cómo seleccionarlo. No hay un botón de envío, así que si lo selecciono, cargará una tabla ajax a continuación. No estoy ...
Python lxml findall con múltiples espacios de nombres
Estoy tratando de analizar un documento XML con múltiples espacios de nombres con lxml, y estoy atascado en obtener el método findall () para devolver algo. Mi XML: <MeasurementRecords ...
AWS Lambda no importa LXML
Estoy tratando de usar el módulo LXML dentro de AWS Lambda y no tengo suerte. Descargué LXML usando el siguiente comando: pip install lxml -t folderPara descargarlo en mi paquete de implementación de funciones lambda. Comprimí el contenido de mi ...
No se puede instalar lxml en Windows, error fatal C1083: No se puede abrir el archivo de inclusión: 'libxml / xmlversion.h'
Python noob, por favor tengan paciencia conmigo. Usé el instalador de Python para v3.5.1 de www.python.org. Mi intención era usar Scrapy para ejecutar algunos scripts. pip install scrapy falló, al igual que easy_install scrapy y otros. Rastreé ...
Cómo eliminar todos los atributos del elemento
Cómo eliminar todos los atributos de los elementos específicos en todo el documento. Estoy intentando algo como esto: from bs4 import UnicodeDammit from lxml import html content = open("source.html").read() document = UnicodeDammit(content, ...