удалить символы не-UTF-8 из xml с объявленной кодировкой = utf-8 - Java

Я должен обработать этот сценарий в Java:

Я получаю запрос в формате XML от клиента с объявленной кодировкой = utf-8. К сожалению, он может содержать не utf-8 символов, и есть требование удалить эти символы из xml на моей стороне (наследие).

Давайте рассмотрим пример, где этот недопустимый XML содержит £ (фунт).

1) Я получаю XML как строку Java с символом £ (сейчас у меня нет доступа к интерфейсу, но я, вероятно, получаю XML как строку Java). Могу ли я использовать replaceAll (£, ""), чтобы избавиться от этого персонажа? Есть потенциальные проблемы?

2) Я получаю XML в виде массива байтов - как безопасно обрабатывать эту операцию в этом случае?

Ответы на вопрос(0)

Ваш ответ на вопрос