Сериализация дополнительных символов Юникода в документы XML с Java

Question

Aug 14, 2012, 03:03 PM

Сериализация дополнительных символов Юникода в документы XML с Java

Я пытаюсь сериализовать документы DOM с помощью дополнительных символов Unicode, таких как U + 1D49C (& # x1D49C ;, заглавная буква математического сценария A). Создание узла с таким символом не является проблемой (я просто устанавливаю значение узла в эквиваленте UTF-16, \ uD835 \ uDC9C "). Однако при сериализации Xalan и XSLTC (с трансформером) и Xerces (с LSSerializer) все создают недопустимые символьные объекты, такие как & amp; # 55349; & amp; # 56476; & quot; вместо "& amp; # 119964;". Я пробовал & quot; нормализовать символы & quot; параметр для LSSerializer, но он не поддерживается. Только Саксонский понимает это правильно, без использования символьной сущности, когда кодировка является юникодом.

Я не могу использовать Saxon на практике (среди прочих причин я использую Java-апплеты и не хочу загружать другой jar-файл), поэтому я ищу решение с библиотеками JDK по умолчанию. Можно ли получить действительные документы XML, сериализованные из документа DOM с дополнительными символами Unicode?

[править] Я нашел кого-то еще, кто столкнулся с этой проблемой:http://www.dragishak.com/?p=131

[edit2] на самом деле, похоже, что он работает с LSSerializer, когда у меня нет xerces на пути к классам (используется класс com.sun.org.apache.xml.internal.serialize.DOMSerializerImpl). Он не работает с преобразователем и com.sun.org.apache.xalan.internal.xsltc.trax.TransformerFactoryImpl.

Сериализация дополнительных символов Юникода в документы XML с Java

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Сериализация дополнительных символов Юникода в документы XML с Java

Ответы на вопрос(2)

Ваш ответ на вопрос

Популярные вопросы