Как преобразовать строку UTF-8 в Unicode?
У меня есть строка, которая отображает символы в кодировке UTF-8, и я хочу преобразовать ее обратно в Unicode.
На данный момент моя реализация выглядит следующим образом:
public static string DecodeFromUtf8(this string utf8String)
{
// read the string as UTF-8 bytes.
byte[] encodedBytes = Encoding.UTF8.GetBytes(utf8String);
// convert them into unicode bytes.
byte[] unicodeBytes = Encoding.Convert(Encoding.UTF8, Encoding.Unicode, encodedBytes);
// builds the converted string.
return Encoding.Unicode.GetString(encodedBytes);
}
Я играю со словом"déjà"
, Я преобразовал это в UTF-8 через этоонлайн инструменти поэтому я начал тестировать свой метод со строкой"déjÃ"
.
К сожалению, в этой реализации строка остается неизменной.
Где я не прав?