C # -Version von HTML Tidy?

Ich bin nur auf der Suche nach einem wirklich einfachen Weg, um HTML zu bereinigen (möglicherweise mit eingebettetem JavaScript-Code). Ich habe es versuchtzwe ander HTML Tidy .NET-Ports und beide lösen Ausnahmen aus ...

Tut mir leid, mit "sauber" meine ich "Einzug". Das HTML ist überhaupt nicht fehlerhaft. Es ist XHTML strict.

I schließlic bekam etwas mit @ arbeit SGML, aber das ist im Ernst das lächerlichste Stück Code, das jemals zum Einrücken von HTML verwendet wurde.

private static string FormatHtml(string input)
{
    var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
    using (var sw = new StringWriter())
    using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
    {
        sgml.Read();
        while (!sgml.EOF)
            xw.WriteNode(sgml, true);
    }
    return sw.ToString();
}

Antworten auf die Frage(8)

Ihre Antwort auf die Frage