Regularer Ausdruck zum Entfernen von HTML-Tags
Ich verwende den folgenden regulären Ausdruck, um HTML-Tags aus einer Zeichenfolge zu entfernen. Es funktioniert nur, wenn ich das schließende Tag lasse. Wenn ich versuche zu entfernen:<a href="blah">blah</a>
es verlässt das<a/>
.
Ich kenne die Syntax für reguläre Ausdrücke überhaupt nicht und habe sie durchgearbeitet. Kann mir jemand mit RegEx-Kenntnissen ein Muster zur Verfügung stellen, das funktioniert?
Hier ist mein Code:
string sPattern = @"<\/?!?(img|a)[^>]*>";
Regex rgx = new Regex(sPattern);
Match m = rgx.Match(sSummary);
string sResult = "";
if (m.Success)
sResult = rgx.Replace(sSummary, "", 1);
Ich möchte das erste Vorkommen des @ entferne<a>
und<img>
Stichworte