Extraindo texto do nó XML com o minidom
Examinei vários posts, mas ainda não encontrei nenhuma resposta que tenha resolvido meu problema.
Exemplo de XML =
<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/>
</TextWithNodes>
Então eu entendo que geralmente se eu tivesse extraídoTextWithNodes
como umNodeList
Eu faria algo como
nodeList = TextWithNodes[0].getElementsByTagName('Node')
for a in nodeList:
node = a.nodeValue
print node
Tudo que eu obtenho éNone
. Eu li que você deve escrevera.childNodes.nodeValue
mas não há um nó filho para a lista de nós, pois parece que todos osNode
Os códigos estão fechando tags? Se eu usara.childNodes
eu recebo[]
.
Quando obtenho o tipo de nó paraa
é tipo 1 eTEXT_NODE
= 3. Não tenho certeza se isso é útil.
Eu gostaria de extrairTEXT1
, TEXT2
etc.