ParseError: niepoprawnie sformatowany (niepoprawny token) przy użyciu cElementTree
Odbieram ciągi xml ze źródła zewnętrznego, które może zawierać niesanitarną treść dodaną przez użytkownika.
Następujący ciąg xml dał ParseError wcElementTree
:
>>> print repr(s)
'<Comment>dddddddd\x08\x08\x08\x08\x08\x08_____</Comment>'
>>> import xml.etree.cElementTree as ET
>>> ET.XML(s)
Traceback (most recent call last):
File "<pyshell#4>", line 1, in <module>
ET.XML(s)
File "<string>", line 106, in XML
ParseError: not well-formed (invalid token): line 1, column 17
Czy istnieje sposób, aby cElementTree nie narzekał?