Извлечение текста из узла XML с помощью минидома
Я просмотрел несколько постов, но не нашел ни одного ответа, который бы решил мою проблему.
Образец XML =
<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/>
</TextWithNodes>
Так что я понимаю, что обычно, если бы я извлекTextWithNodes
какNodeList
Я бы сделал что-то вроде
nodeList = TextWithNodes[0].getElementsByTagName('Node')
for a in nodeList:
node = a.nodeValue
print node
Все, что я получаю, этоNone
, Я прочитал, что вы должны написатьa.childNodes.nodeValue
но в списке узлов нет дочернего узла, так как он выглядит какNode
Идентификаторы закрывают теги? Если я используюa.childNodes
я получил[]
.
Когда я получу тип узла дляa
это тип 1 иTEXT_NODE
= 3. Я не уверен, что это полезно.
Я хотел бы извлечьTEXT1
, TEXT2
, так далее.