Преобразование специальных символов, таких как ü и Ã, обратно в их оригинальные латинские аналоги алфавитов в C #
Мне дали экспорт из базы данных MySQL, которая, кажется, имела егоs кодировка запуталась со временем и содержит смесьHTML char codes
такие как& uuml;
и более проблемные символы, представляющие одинаковые буквы, такие какü
а такжеÃ
, Моя задача состоит в том, чтобы вернуть некоторую последовательность обратно в файл и привести все в правильные латинские символы, например,ú
а также .ó
Пример строки, с которой я имею дело
DesinfektionslösungstüШер Феr Fläчен
Который должен приравнять к
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
50 Tattoo Desinfektionsl ö sungst ü cher f ü r Fl ä chen
Есть ли метод, доступный в C # /. Net 4.5, который успешно перекодирует подобныеü
а такжеÃ
к?UTF-8
Иначе какой подход был бы целесообразен?
Также является символом абзаца¶
в приведенном выше примере строки фактический символ абзаца или часть какой-либо другой комбинации символов?
Я создал таблицу поиска в случае необходимости найти и заменить, что ниже, но я не уверен, насколько она завершена.
É -> É
“ -> "
†-> "
Ç -> Ç
à -> Ã
é, 'é
à -> ú -> ú
• -> -
Ø -> Ø
õ -> õ
à -> í
â -> â
ã -> ã
ê -> ê
á -> á
é -> é
ó -> ó
– -> –
ç -> ç
ª -> ª
º -> º
à -> à