Las viñetas en PDF vienen como signos de interrogación al analizar Apache Tika en java

Estoy analizando archivos PDF utilizando Apache Tika (tika-app-1.3) con este código:

InputStream input = new FileInputStream("Introduction.pdf");  
AutoDetectParser parser = new AutoDetectParser();
BodyContentHandler handler = new BodyContentHandler(100 * 1024 * 1024);
Metadata metadata = new Metadata();
parser.parse(input, handler, metadata);
System.out.println(handler.toString());

handler.toString() muestra un texto PDF, pero este texto también contiene viñetas, que se muestran como? Símbolo, pero quiero estas balas como están. ¿Hay alguna manera de obtener el contenido original, como está usando Apache Tika? ¿O dónde debe definirse la codificación al analizar?

Respuestas a la pregunta(1)

Su respuesta a la pregunta