Resultados de la búsqueda a petición "lxml"
¿Cómo debo lidiar con un XMLSyntaxError en el lxml de Python mientras analizo un archivo XML grande?
Estoy tratando de analizar un archivo XML de más de 2 GB con la biblioteca lxml de Python. Desafortunadamente, el archivo XML no tiene una línea que indique la codificación de caracteres, por lo que tengo que configurarlo manualmente. ...
Cómo analizar HTML con formato incorrecto en Python
Necesito explorar el árbol DOM de un documento HTML analizado. Estoy usando uTidyLib antes de analizar la cadena con lxml a = tidy.parseString (html_code, opciones) dom = etree.fromstring (str (a)) a veces recibo un error, parece que ...
¿Cómo seleccionar padre en función del hijo en lxml?
Tengo este código: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> </table> ...
lxml error "IOError: Error al leer el archivo" al analizar facebook mobile en un script de python scraper
Uso un script modificado deIniciar sesión en Facebook con python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] post: #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" ...
Python sax a lxml para 80+ GB XML
¿Cómo leerías un archivo XML usando sax y lo convertirías en un elemento lxml etree.iterparse? Para proporcionar una descripción general del problema, he creado una herramienta de ingestión XML que utiliza lxml para una fuente XML que tendrá ...
import lxml falla en OSX después de (aparentemente) una instalación exitosa
Estoy intentando instalar lxml para python en OS X 10.6.8 Corrísudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml en el terminal basado en esta respuesta a una pregunta que instala lxml:https: //stackoverflow.com/a/6545556/21633 ...
using lxml e iterparse () para analizar un archivo XML grande (+ - 1Gb)
Tengo que analizar un archivo XML de 1 Gb con una estructura como la siguiente y extraer el texto dentro de las etiquetas "Autor" y "Contenido": <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum ...
parsing tabla HTML usando python - HTMLparser o lxml
Tengo una página html que consiste en una tabla y quiero obtener todos los valores en td, tr en esa tabla. He intentado trabajar con beautifulsoup pero ahora quería trabajar en lxml o analizador HML con python. He adjuntado el ejemplo. Quiero ...