Wie bringe ich JTIdy dazu, HTML-Dokumente wohlgeformt zu machen?

Ich verwende JTidy v. R938. Ich verwende diesen Code, um zu versuchen, eine Seite aufzuräumen ...

<code>final Tidy tidy = new Tidy();
tidy.setQuiet(false);
tidy.setShowWarnings(true);
tidy.setShowErrors(0);
tidy.setMakeClean(true);
Document document = tidy.parseDOM(conn.getInputStream(), null);
</code>

Aber wenn ich diese URL parse -http://www.chicagoreader.com/chicago/EventSearch?narrowByDate=This+Week&eventCategory=93922&keywords=&page=1Dinge werden nicht aufgeräumt. Zum Beispiel die META-Tags auf der Seite, wie

<code><META http-equiv="Content-Type" content="text/html; charset=UTF-8">
</code>

bleiben als

<code><META http-equiv="Content-Type" content="text/html; charset=UTF-8">
</code>

anstelle eines "</ META>" - Tags oder als "<META http-equiv =" Content-Type "content =" text / html; Zeichensatz = UTF-8 "/>". Ich bestätige dies, indem ich das resultierende JTidy org.w3c.dom.Document als String ausgebe.

Was kann ich tun, damit JTidy die Seite wirklich aufräumt - d. H. Gut formatiert? Mir ist klar, dass es andere Tools gibt, aber diese Frage bezieht sich speziell auf die Verwendung von JTIdy.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage