Serialisierung zusätzlicher Unicode-Zeichen in XML-Dokumente mit Java

Ich versuche, DOM-Dokumente mit zusätzlichen Unicode-Zeichen wie U + 1D49C (𝒜, Großbuchstabe A) zu serialisieren. Das Erstellen eines Knotens mit einem solchen Zeichen ist kein Problem (ich habe nur den Knotenwert auf das UTF-16-Äquivalent "\ uD835 \ uDC9C" gesetzt). Bei der Serialisierung jedoch erstellen Xalan und XSLTC (mit einem Transformer) sowie Xerces (mit LSSerializer) ungültige Zeichenentitäten wie "& # 55349; & # 56476;" anstelle von "& # 119964;" Ich habe den Parameter "normalize-characters" für LSSerializer ausprobiert, aber er wird nicht unterstützt. Nur Saxon macht es richtig, ohne eine Zeichenentität zu verwenden, wenn die Codierung Unicode ist.

Ich kann Saxon in der Praxis nicht verwenden (unter anderem verwende ich Java-Applets und möchte kein weiteres Jar laden), daher suche ich nach einer Lösung mit den Standard-JDK-Bibliotheken. Ist es möglich, gültige XML-Dokumente aus einem DOM-Dokument mit zusätzlichen Unicode-Zeichen zu serialisieren?

[Bearbeiten] Ich habe jemanden gefunden, der auf dieses Problem gestoßen ist:http://www.dragishak.com/?p=131

[edit2] Eigentlich scheint es mit LSSerializer zu funktionieren, wenn ich keine xerces im Klassenpfad habe (die verwendete Klasse ist com.sun.org.apache.xml.internal.serialize.DOMSerializerImpl). Es funktioniert nicht mit einem Transformator und com.sun.org.apache.xalan.internal.xsltc.trax.TransformerFactoryImpl.

Antworten auf die Frage(2)

Ihre Antwort auf die Frage