C # версия HTML Tidy?
Я просто ищу действительно простой способ очистить некоторый HTML (возможно, с помощью встроенного кода JavaScript). Я старалсядва разные HTML Tidy Порты .NET и оба бросают исключения ...
Извините, под «чистым» я подразумеваю «отступ». HTML вообще не искажен. ЭтоXHTML строги.
I в конце концов что-то работает сSGML, но это действительно самый нелепый кусок кода, когда-либо создававший отступ для HTML.
private static string FormatHtml(string input)
{
var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
using (var sw = new StringWriter())
using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
{
sgml.Read();
while (!sgml.EOF)
xw.WriteNode(sgml, true);
}
return sw.ToString();
}