Extraer texto del nodo XML con minidom
He revisado varias publicaciones, pero no he encontrado ninguna respuesta que haya resuelto mi problema.
Muestra XML =
<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/>
</TextWithNodes>
Así que entiendo que por lo general si hubiera extraídoTextWithNodes
como unNodeList
Yo haria algo como
nodeList = TextWithNodes[0].getElementsByTagName('Node')
for a in nodeList:
node = a.nodeValue
print node
Todo lo que consigo esNone
. He leído que debes escribira.childNodes.nodeValue
pero no hay un nodo secundario a la lista de nodos ya que parece que todo elNode
¿Las identificaciones están cerrando etiquetas? Si yo usoa.childNodes
yo obtengo[]
.
Cuando obtengo el tipo de nodo paraa
es tipo 1 yTEXT_NODE
= 3. No estoy seguro de si eso es útil.
Me gustaria extraerTEXT1
, TEXT2
, etc.