¿Cómo hago que JTIdy haga que los documentos HTML estén bien formados?

Estoy usando JTidy v. R938. Estoy usando este código para intentar limpiar una página ...

final Tidy tidy = new Tidy();
tidy.setQuiet(false);
tidy.setShowWarnings(true);
tidy.setShowErrors(0);
tidy.setMakeClean(true);
Document document = tidy.parseDOM(conn.getInputStream(), null);

Pero cuando analizo esta URL -http://www.chicagoreader.com/chicago/EventSearch?narrowByDate=This+Week&eventCategory=93922&keywords=&page=1, las cosas no se están limpiando. Por ejemplo, las etiquetas META en la página, como

<META http-equiv="Content-Type" content="text/html; charset=UTF-8">

permanecer como

<META http-equiv="Content-Type" content="text/html; charset=UTF-8">

en lugar de tener una etiqueta "</META>" o aparecer como "<META http-equiv =" Content-Type "content =" text / html; conjunto de caracteres = UTF-8 "/>". Confirmo esto generando el JTidy org.w3c.dom.Document resultante como una cadena.

¿Qué puedo hacer para que JTidy realmente limpie la página, es decir, para que esté bien formada? Me doy cuenta de que existen otras herramientas, pero esta pregunta se relaciona específicamente con el uso de JTIdy.