Zastąp kody HTML równoważnymi znakami w Javie [duplikaty]
To pytanie ma już tutaj odpowiedź:
Java: Jak odblokować encje znaków HTML w Javie? 10 odpowiedziObecnie pracuję nad konwersją kodów HTML z równoważnymi znakami w Javie. Muszę przekonwertować poniższy kod na znaki.
è - è
® - ®
& - &
ñ - ñ
& - &
Próbowałem użyć wzorca wyrażenia regularnego
(&#x)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)([\\d|\\w]*)(;)
Kiedy debuguję,matcher.find()
daje mitrue
ale kontrolka pomija pętlę, w której napisałem kod do konwersji. Nie wiem, co się tam dzieje.
Czy istnieje również sposób na zoptymalizowanie tego wyrażenia regularnego?
Każda pomoc jest doceniana.
Wyjątek
java.lang.NumberFormatException: For input string: "x26"
at java.lang.NumberFormatException.forInputString(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at java.lang.Integer.parseInt(Unknown Source)
at org.apache.commons.lang.Entities.unescape(Entities.java:683)
at org.apache.commons.lang.StringEscapeUtils.unescapeHtml(StringEscapeUtils.java:483)