Analyse einer großen XML-Datei mit dem Fehler Python-etree.parse

Question

Jul 09, 2012, 06:25 AM

Analyse einer großen XML-Datei mit dem Fehler Python-etree.parse

Der Versuch, die folgende Python-Datei mit der Funktion lxml.etree.iterparse zu analysieren.

"sampleoutput.xml"

<item>
  <title>Item 1</title>
  <desc>Description 1</desc>
</item>
<item>
  <title>Item 2</title>
  <desc>Description 2</desc>
</item>

Ich habe den Code von ausprobiertAnalysieren einer großen XML-Datei mit Python lxml und Iterparse

vor dem Aufruf von etree.iterparse (MYFILE) habe ich MYFILE = open ausgeführt ("/ Users / eric / Desktop / wikipedia_map / sampleoutput.xml", "r")

Aber es taucht der folgende Fehler auf

Traceback (most recent call last):
  File "/Users/eric/Documents/Programming/Eclipse_Workspace/wikipedia_mapper/testscraper.py", line 6, in <module>
    for event, elem in context :
  File "iterparse.pxi", line 491, in lxml.etree.iterparse.__next__ (src/lxml/lxml.etree.c:98565)
  File "iterparse.pxi", line 543, in lxml.etree.iterparse._read_more_events (src/lxml/lxml.etree.c:99086)
  File "parser.pxi", line 590, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:74712)
lxml.etree.XMLSyntaxError: Extra content at the end of the document, line 5, column 1

irgendwelche Ideen? Danke dir!