Konvertieren von Sonderzeichen wie à und à zurück zu ihren ursprünglichen lateinischen Alphabeten in C #

Ich habe einen Export aus einer MySQL-Datenbank erhalten, deren Codierung im Laufe der Zeit etwas durcheinander zu sein scheint und die eine Mischung aus enthältHTML char codes sowie& uuml; und problematischere Zeichen, die dieselben Buchstaben darstellen wieü undÃ. Es ist meine Aufgabe, die Datei wieder konsistent zu machen und alles in die richtigen lateinischen Zeichen zu bringen, z.ú undó.

Ein Beispiel für die Art von Zeichenfolge, mit der ich es zu tun habe, ist

Desinfektionslösung für Flüchen

Welches sollte gleichzusetzen

50 Tattoo Desinfektionsl ö    sungst ü    cher f ü    r Fl ä    chen 
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen

Gibt es eine in C # /. Net 4.5 verfügbare Methode, mit der solche Dateien erfolgreich neu codiert werden können?ü undàzuUTF-8?

Andernfalls wäre welcher Ansatz ratsam?

Ist auch das Punktzeichen In der obigen Beispielzeichenfolge ein tatsächliches Absatzzeichen oder ein Teil einer anderen Zeichenkombination?

Ich habe eine Nachschlagetabelle für den Fall erstellt, dass gesucht und ersetzt werden muss. Die folgende Tabelle ist jedoch nicht vollständig.

É -> É
“ -> "
†-> "
Ç -> Ç
à -> Ã
é, 'é
à -> ú -> ú
• -> -
Ø -> Ø
õ -> õ
í -> í
â -> â
ã -> ã
ê -> ê
á -> á
é -> é
ó -> ó
– -> –
ç -> ç
ª -> ª
º -> º
à  -> à

Antworten auf die Frage(5)

Ihre Antwort auf die Frage