Converter entidades de caracteres para seus equivalentes unicode
Eu tenho seqüências de caracteres codificadas em html em um banco de dados, mas muitas das entidades de caracteres não são apenas o padrão&
e<
. Entidades como“
e—
. Infelizmente, precisamos alimentar esses dados em um leitor de rss baseado em flash e o flash não lê essas entidades, mas elas lêem o equivalente unicode (ex“
).
Usando o .Net 4.0, existe algum método utilitário que converta a string codificada em html para usar entidades de caracteres codificados em unicod
Aqui está um exemplo melhor do que eu preciso. O db tem seqüências de caracteres html como:<p>John & Sarah went to see $ldquo;Scream 4$rdquo;.</p>
e o que eu preciso exibir no documento rss / xml no<description>
tag é:<p>John &#38; Sarah went to see &#8220;Scream 4&#8221;.</p>
Estou usando um XmlTextWriter para criar o documento xml a partir dos registros do banco de dados semelhantes a este código de exemplohttp: //www.dotnettutorials.com/tutorials/advanced/rss-feed-asp-net-csharp.asp
Então, preciso substituir todas as entidades de caracteres dentro da string html do db por seus unicode equivalentes porque o leitor de rss baseado em flash não reconhece nenhuma entidade além das mais comuns, como&
.