Синтаксический анализ и кодирование
У меня есть контакт, который испытывает проблемы с SAX при разборе файлов RSS и Atom. По его словам, этоs, как будто текст, исходящий из элементов Item, усекается с апострофом или иногда с ударением. Кажется, есть проблема и с кодировкой.
Я попробовал SAX, и у меня тоже есть кое-какое усечение, но покане мог копать дальше. Я'Буду признателен за некоторые предложения, если кто-то там занимался этим раньше.
Это код, которыйИспользуется в ContentHandler:
public void characters( char[], int start, int end ) throws SAXException {
//
link = new String(ch, start, end);
Редактировать: проблема кодирования может быть из-за хранения информации в байтовом массиве, как я знаю, Java работает в Unicode.