Analizowanie i kodowanie Saxa

Mam kontakt, który ma problemy z SAX podczas analizowania plików RSS i Atom. Według niego jest tak, jakby tekst pochodzący z elementów Elementu był obcięty przy apostrofie lub czasami jako znak akcentowany. Wydaje się, że problem dotyczy także kodowania.

Wypróbowałem SAX i mam trochę obcięcia, ale nie byłem w stanie dalej kopać. Byłbym wdzięczny za pewne sugestie, jeśli ktoś tam poradził sobie wcześniej.

To jest kod, który jest używany w ContentHandler:

public void characters( char[], int start, int end ) throws SAXException {
//
    link = new String(ch, start, end);

Edytuj: Problem z kodowaniem może być spowodowany przechowywaniem informacji w tablicy bajtów, ponieważ wiem, że Java działa w Unicode.

questionAnswers(3)

yourAnswerToTheQuestion