Resultados de la búsqueda a petición "iterparse"

3 la respuesta

¿Por qué lxml.etree.iterparse () está consumiendo toda mi memoria?

Esto eventualmente consume toda mi memoria disponible y luego se elimina el proceso. He intentado cambiar la etiqueta de

2 la respuesta

¿Por qué elementtree.ElementTree.iterparse usa tanta memoria?

Estoy usando elementtree.ElementTree.iterparse para analizar un archivo xml grande (371 MB).Mi código es básicamente este:

4 la respuesta

Analizar archivos XML enormes y mal codificados en Python

He estado trabajando en el código que analiza los archivos XML externos. Algunos de estos archivos son enormes, hasta gigabytes de datos. No hace falta decir...

8 la respuesta

Analizando iterativamente HTML (con lxml?)

Actualmente estoy tratando de analizar iterativamente un documento HTML muy grande (lo sé ... qué asco) para reducir la cantidad de memoria utilizada. El problema que tengo es que recibo errores de sintaxis XML como: lxml.etree.XMLSyntaxError: ...

6 la respuesta

using lxml e iterparse () para analizar un archivo XML grande (+ - 1Gb)

Tengo que analizar un archivo XML de 1 Gb con una estructura como la siguiente y extraer el texto dentro de las etiquetas "Autor" y "Contenido": <Database> <BlogPost> <Date>MM/DD/YY</Date> <Author>Last Name, Name</Author> <Content>Lorem ipsum ...