Jsoup desempaña personajes especiales

Estoy usando Jsoup para eliminar todas las imágenes de una página HTML. Recibo la página a través de una respuesta HTTP, que también contiene el conjunto de caracteres de contenido.

El problema es que Jsoup desempaqueta algunos caracteres especiales.

Por ejemplo, para la entrada:

<html><head></head><body><p>isn&rsquo;t</p></body></html>

despues de correr

String check = "<html><head></head><body><p>isn&rsquo;t</p></body></html>";
Document doc = Jsoup.parse(check);
System.out.println(doc.outerHtml());

Yo obtengo:

<html><head></head><body><p>isn’t</p></body></html><p></p>

Quiero evitar cambiar el htmlde cualquier otra manera, excepto para eliminar las imágenes.

Al usar el comando:

doc.outputSettings().prettyPrint(false).charset("ASCII").escapeMode(EscapeMode.extended);

Obtengo la salida correcta, pero estoy seguro de que hay casos en los que ese juego de caracteres no será bueno. Solo quiero usar el juego de caracteres especificado en el encabezado HTTP y me temo que esto cambiará mi documento de una manera que no puedo predecir. ¿Existe algún otro método más limpio para eliminar las imágenes sin cambiar nada más sin darse cuenta?

¡Gracias!

Respuestas a la pregunta(1)

Su respuesta a la pregunta