Регулярное выражение для удаления тегов HTML
Я использую следующее регулярное выражение, чтобы удалить HTML-теги из строки. Это работает, за исключением того, что я оставляю закрывающий тег. Если я попытаюсь удалить:<a href="blah">blah</a>
это оставляет<a/>
.
Я не знаю синтаксиса регулярных выражений вообще и нащупал это. Может кто-то со знанием RegEx, пожалуйста, предоставьте мне шаблон, который будет работать.
Вот мой код:
string sPattern = @"<\/?!?(img|a)[^>]*>";
Regex rgx = new Regex(sPattern);
Match m = rgx.Match(sSummary);
string sResult = "";
if (m.Success)
sResult = rgx.Replace(sSummary, "", 1);
Я надеюсь удалить первый случай<a>
а также<img>
теги.