Wyodrębnianie tekstu z węzła XML za pomocą minidomu
Przejrzałem kilka postów, ale nie znalazłem żadnych odpowiedzi, które rozwiązałyby mój problem.
Przykładowy XML =
<TextWithNodes>
<Node id="0"/>TEXT1<Node id="19"/>TEXT2 <Node id="20"/>TEXT3<Node id="212"/>
</TextWithNodes>
Rozumiem to więc zazwyczaj, gdybym to zrobiłTextWithNodes
jakNodeList
Zrobiłbym coś takiego
nodeList = TextWithNodes[0].getElementsByTagName('Node')
for a in nodeList:
node = a.nodeValue
print node
Wszystko co dostaję toNone
. Czytałem, że musisz pisaća.childNodes.nodeValue
ale nie ma węzła podrzędnego na liście węzłów, ponieważ wygląda jak wszystkieNode
Idy zamykają tagi? Jeśli używama.childNodes
dostaję[]
.
Kiedy otrzymam typ węzła dlaa
to jest typ 1 iTEXT_NODE
= 3. Nie jestem pewien, czy to jest pomocne.
Chciałbym wyodrębnićTEXT1
, TEXT2
itd.