Wyodrębnij tekst i łącza z HTML za pomocą wyrażeń regularnych
Chciałbym wyodrębnić tekst z dokumentu html, zachowując w nim linki. na przykład:
Z tego kodu HTML
<div class="CssClass21">bla1 bla1 bla1 <a href="http://www.ibrii.com">go to ibrii</a> bla2 bla2 bla2 <img src="http://www.contoso.com/hello.jpg"> <span class="cssClass34">hello hello</span>
Chciałbym to wyciągnąć
bla1 bla1 bla1 <a href="http://www.ibrii.com">go to ibrii</a> bla2 bla2 bla2 hello hello
W innym poście na StackOverflow znalazłem RegEx<[^>]*>
który pozwala wyodrębnić tekst, zastępując każde dopasowanie niczym. Jak mogę wykluczyć znaczniki zakotwiczenia z meczu? Wydaje się, że RegEx nie pozwala na odwrotne dopasowanie.