Decodifique ou desmarque \ u00f0 \ u009f \ u0091 \ u008d para 👍

Todos sabemos que o UTF-8 é difícil. Eu exportei minhas mensagens do Facebook e o arquivo JSON resultante escapou de todos os caracteres não-ascii para pontos de código unicode.

Estou procurando uma maneira fácil de remover esses pontos de código unicode para o UTF-8 antigo comum. Eu também adoraria usar o PowerShell.

eu tentei

$str = "\u00f0\u009f\u0091\u008d"
[Regex]::Replace($str, "\\[Uu]([0-9A-Fa-f]{4})", `
{[char]::ToString([Convert]::ToInt32($args[0].Groups[1].Value, 16))} )

mas isso só me dáð como resultado, não.

Eu também tentei usar o Notepad ++ e encontrei este post do SO:Como converter Unicode de escape (por exemplo,\u0432\u0441\u0435) para caracteres UTF-8 (no) no Notepad ++. A resposta aceita também resulta exatamente igual ao exemplo acima:ð.

Encontrei a solução de decodificação aqui: oBiblioteca UTF8.js que decodifica o texto perfeitamente e você podeexperimente aqui (com\u00f0\u009f\u0091\u008d como entrada).

Existe uma maneira no PowerShell de decodificar\u00f0\u009f\u0091\u008d receber ? Eu adoraria ter UTF-8 real em minhas mensagens exportadas do Facebook para que eu possa realmente lê-las.

Pontos de bônus por me ajudar a entender o que\u00f0\u009f\u0091\u008d na verdade representa (além de seralguma representação hexadecimal UTF-8) Por que é o mesmo queU+1F44D ou\uD83D\uDC4D em C ++?