¿Cómo decodificar códigos html usando Java? [duplicar]
Posible duplicado:
Java: ¿Cómo decodificar entidades de caracteres HTML en Java como HttpUtility.HtmlDecode?
Necesito extraer párrafos (comotitle
en StackOverflow) de unhtml
expediente.
Puedo usar expresiones regulares en Java para extraer los campos que necesito, pero tengo quedecode
Los campos obtenidos.
EJEMPLO
campo extraído:
Paging Lucene's search results (with **;** among **'** and **s**)
campo después de la decodificación:
Paging Lucene's search results
¿Hay alguna clase en java que me permita convertir estos códigos html?