Resultados de la búsqueda a petición "lxml"

8 la respuesta

¿Cómo debo lidiar con un XMLSyntaxError en el lxml de Python mientras analizo un archivo XML grande?

Estoy tratando de analizar un archivo XML de más de 2 GB con la biblioteca lxml de Python. Desafortunadamente, el archivo XML no tiene una línea que indique la codificación de caracteres, por lo que tengo que configurarlo manualmente. ...

4 la respuesta

Cómo analizar HTML con formato incorrecto en Python

Necesito explorar el árbol DOM de un documento HTML analizado. Estoy usando uTidyLib antes de analizar la cadena con lxml a = tidy.parseString (html_code, opciones) dom = etree.fromstring (str (a)) a veces recibo un error, parece que ...

8 la respuesta

¿Cómo seleccionar padre en función del hijo en lxml?

Tengo este código: <table cellspacing="1" cellpadding="1" border="0"> <tbody> <tr> <td>Something else</td> </tr> <tr> <td valign="top"> <a href="http://exact url">Something</a> </td> <td valign="top">Something else</td> </tr> </tbody> </table> ...

2 la respuesta

lxml error "IOError: Error al leer el archivo" al analizar facebook mobile en un script de python scraper

Uso un script modificado deIniciar sesión en Facebook con python [https://stackoverflow.com/questions/2030652/logging-into-facebook-with-python] post: #!/usr/bin/python2 -u # -*- coding: utf8 -*- facebook_email = "[email protected]" ...

6 la respuesta

Python sax a lxml para 80+ GB XML

¿Cómo leerías un archivo XML usando sax y lo convertirías en un elemento lxml etree.iterparse? Para proporcionar una descripción general del problema, he creado una herramienta de ingestión XML que utiliza lxml para una fuente XML que tendrá ...

4 la respuesta

import lxml falla en OSX después de (aparentemente) una instalación exitosa

Estoy intentando instalar lxml para python en OS X 10.6.8 Corrísudo env ARCHFLAGS="-arch i386 -arch x86_64" easy_install lxml en el terminal basado en esta respuesta a una pregunta que instala lxml:https: //stackoverflow.com/a/6545556/21633 ...

6 la respuesta

using lxml e iterparse () para analizar un archivo XML grande (+ - 1Gb)

Tengo que analizar un archivo XML de 1 Gb con una estructura como la siguiente y extraer el texto dentro de las etiquetas "Autor" y "Contenido": <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum ...

4 la respuesta

parsing tabla HTML usando python - HTMLparser o lxml

Tengo una página html que consiste en una tabla y quiero obtener todos los valores en td, tr en esa tabla. He intentado trabajar con beautifulsoup pero ahora quería trabajar en lxml o analizador HML con python. He adjuntado el ejemplo. Quiero ...