C # -Version von HTML Tidy?
Ich bin nur auf der Suche nach einem wirklich einfachen Weg, um HTML zu bereinigen (möglicherweise mit eingebettetem JavaScript-Code). Ich habe es versuchtzwe ander HTML Tidy .NET-Ports und beide lösen Ausnahmen aus ...
Tut mir leid, mit "sauber" meine ich "Einzug". Das HTML ist überhaupt nicht fehlerhaft. Es ist XHTML strict.
I schließlic bekam etwas mit @ arbeit SGML, aber das ist im Ernst das lächerlichste Stück Code, das jemals zum Einrücken von HTML verwendet wurde.
private static string FormatHtml(string input)
{
var sgml = new SgmlReader {DocType = "HTML", InputStream = new StringReader(input)};
using (var sw = new StringWriter())
using (var xw = new XmlTextWriter(sw) { Indentation = 2, Formatting = Formatting.Indented })
{
sgml.Read();
while (!sgml.EOF)
xw.WriteNode(sgml, true);
}
return sw.ToString();
}