Nicht-UTF-8-Zeichen aus XML mit deklarierter Kodierung entfernen = utf-8 - Java
Ich muss dieses Szenario in Java behandeln:
Ich erhalte eine Anfrage in XML-Form von einem Client mit der deklarierten Kodierung = utf-8. Leider kann es sein, dass es keine UTF-8-Zeichen enthält und dass diese Zeichen aus der XML-Datei auf meiner Seite entfernt werden müssen (Legacy).
Betrachten wir ein Beispiel, in dem diese ungültige XML £ (Pfund) enthält.
1) Ich erhalte XML als Java-String mit £ (ich habe momentan keinen Zugriff auf das Interface, aber ich erhalte wahrscheinlich XML als Java-String). Kann ich replaceAll (£, "") verwenden, um dieses Zeichen zu entfernen? Mögliche Probleme?
2) Ich erhalte XML als Array von Bytes - wie gehe ich in diesem Fall sicher vor?