ElementTree: Element.remove () iteración de salto
Tengo este archivo de entrada xml:
<?xml version="1.0"?>
<zero>
<First>
<second>
<third-num>1</third-num>
<third-def>object001</third-def>
<third-len>458</third-len>
</second>
<second>
<third-num>2</third-num>
<third-def>object002</third-def>
<third-len>426</third-len>
</second>
<second>
<third-num>3</third-num>
<third-def>object003</third-def>
<third-len>998</third-len>
</second>
</First>
</zero>
Mi objetivo es eliminar cualquier segundo nivel para el cual<third-def>
Eso no es un valor. Para hacer eso, escribí este código:
try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET
inputfile='inputfile.xml'
tree = ET.parse(inputfile)
root = tree.getroot()
elem = tree.find('First')
for elem2 in tree.iter(tag='second'):
if elem2.find('third-def').text == 'object001':
pass
else:
elem.remove(elem2)
#elem2.clear()
Mi problema eselem.remove(elem2)
. Se salta cualquier otro segundo nivel. Aquí está la salida de este código:
<?xml version="1.0" ?>
<zero>
<First>
<second>
<third-num>1</third-num>
<third-def>object001</third-def>
<third-len>458</third-len>
</second>
<second>
<third-num>3</third-num>
<third-def>object003</third-def>
<third-len>998</third-len>
</second>
</First>
</zero>
Ahora si descomento elelem2.clear()
línea, el script funciona perfectamente, pero el resultado es menos agradable ya que mantiene todo lo eliminadosegundos niveles:
<?xml version="1.0" ?>
<zero>
<First>
<second>
<third-num>1</third-num>
<third-def>object001</third-def>
<third-len>458</third-len>
</second>
<second/>
<second/>
</First>
</zero>
¿Alguien tiene idea de por qué mielement.remove()
declaración es incorrecta?