Как сделать так, чтобы JTIdy делал HTML-документы правильно сформированными?

Я использую JTidy v. R938. Я использую этот код для очистки страницы & # x2026;

<code>final Tidy tidy = new Tidy();
tidy.setQuiet(false);
tidy.setShowWarnings(true);
tidy.setShowErrors(0);
tidy.setMakeClean(true);
Document document = tidy.parseDOM(conn.getInputStream(), null);
</code>

Но когда я анализирую этот URL -http://www.chicagoreader.com/chicago/EventSearch?narrowByDate=This+Week&eventCategory=93922&keywords=&page=1вещи не убираются. Например, теги META на странице, такие как

<code><META http-equiv="Content-Type" content="text/html; charset=UTF-8">
</code>

оставаться как

<code><META http-equiv="Content-Type" content="text/html; charset=UTF-8">
</code>

вместо того, чтобы иметь "/ META" & quot; помечать или отображать как & quot; & lt; META http-equ = & quot; Content-Type & quot; содержание = & Quot; текст / HTML; кодировка = UTF-8 & Quot; / & GT; & Quot ;. Я подтверждаю это, выводя полученный JTidy org.w3c.dom.Document в виде строки.

Что я могу сделать, чтобы JTidy действительно очистил страницу - то есть, чтобы она была правильно оформлена? Я понимаю, что есть и другие инструменты, но этот вопрос конкретно касается использования JTIdy.

Ответы на вопрос(4)

Ваш ответ на вопрос