¿Por qué lxml.etree.iterparse () está consumiendo toda mi memoria?
Esto eventualmente consume toda mi memoria disponible y luego se elimina el proceso. He intentado cambiar la etiqueta deschedule
a etiquetas "más pequeñas" pero eso no hizo una diferencia.
¿Qué estoy haciendo mal / cómo puedo procesar este archivo grande coniterparse()
?
import lxml.etree
for schedule in lxml.etree.iterparse('really-big-file.xml', tag='schedule'):
print "why does this consume all my memory?"
Puedo cortarlo fácilmente y procesarlo en trozos más pequeños, pero eso es más feo de lo que me gustaría.