Analizowanie i kodowanie Saxa
Mam kontakt, który ma problemy z SAX podczas analizowania plików RSS i Atom. Według niego jest tak, jakby tekst pochodzący z elementów Elementu był obcięty przy apostrofie lub czasami jako znak akcentowany. Wydaje się, że problem dotyczy także kodowania.
Wypróbowałem SAX i mam trochę obcięcia, ale nie byłem w stanie dalej kopać. Byłbym wdzięczny za pewne sugestie, jeśli ktoś tam poradził sobie wcześniej.
To jest kod, który jest używany w ContentHandler:
public void characters( char[], int start, int end ) throws SAXException {
//
link = new String(ch, start, end);
Edytuj: Problem z kodowaniem może być spowodowany przechowywaniem informacji w tablicy bajtów, ponieważ wiem, że Java działa w Unicode.